home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Standards 1994 January / InfoMagic Standards - January 1994.iso / ccitt / 1988 / troff / 5_1_07.tro < prev    next >
Text File  |  1991-12-13  |  127KB  |  4,472 lines

  1. .rs
  2. .\" Troff code generated by TPS Convert from ITU Original Files
  3. .\"                 Not Copyright ( c) 1991 
  4. .\"
  5. .\" Assumes tbl, eqn, MS macros, and lots of luck.
  6. .TA 1c 2c 3c 4c 5c 6c 7c 8c
  7. .ds CH
  8. .ds CF
  9. .EQ
  10. delim @@
  11. .EN
  12. .nr LL 40.5P
  13. .nr ll 40.5P
  14. .nr HM 3P
  15. .nr FM 6P
  16. .nr PO 4P
  17. .nr PD 9p
  18. .po 4P
  19.  
  20. .rs
  21. \v | 5i'
  22. .sp 1P
  23. .ce 1000
  24. \v'12P'
  25. \s12PART\ II
  26. \v'4P'
  27. .RT
  28. .ce 0
  29. .sp 1P
  30. .ce 1000
  31. \fBSUPPLEMENTS\ TO\ SERIES\ P\ RECOMMENDATIONS\fR 
  32. .EF '%     \ \ \ ^''
  33. .OF ''' \ \ \ ^    %'
  34. .ce 0
  35. .sp 1P
  36. .LP
  37. .rs
  38. .sp 34P
  39. .LP
  40. .bp
  41. .LP
  42. \fBMONTAGE:\ \fR PAGE PAIRE = PAGE BLANCHE
  43. .sp 1P
  44. .RT
  45. .LP
  46. .bp
  47. .sp 2P
  48. .LP
  49. \fBSupplement\ No.\ 1\fR 
  50. .RT
  51. .sp 2P
  52. .ce 1000
  53. \fBPRECAUTIONS\ TO\ BE\ TAKEN\ FOR\ CORRECT\ \fR \fBINSTALLATION\fR 
  54. .EF '%    Volume\ V\ \(em\ Suppl.\ No.\ 1''
  55. .OF '''Volume\ V\ \(em\ Suppl.\ No.\ 1    %'
  56. .ce 0
  57. .sp 1P
  58. .ce 1000
  59. \fBAND\ MAINTENANCE\ OF\ AN\ IRS\fR 
  60. .ce 0
  61. .sp 1P
  62. .ce 1000
  63. (For this Supplement see Volume V of the \fIOrange Book\fR )
  64. .sp 9p
  65. .RT
  66. .ce 0
  67. .sp 1P
  68. .sp 2P
  69. .LP
  70. \fBSupplement\ No.\ 2\fR 
  71. .RT
  72. .sp 2P
  73. .sp 1P
  74. .ce 1000
  75. \fBMETHODS\ USED\ FOR\ ASSESSING\ TELEPHONY\ TRANSMISSION\ PERFORMANCE\fR 
  76. .EF '%    Volume\ V\ \(em\ Suppl.\ No.\ 2''
  77. .OF '''Volume\ V\ \(em\ Suppl.\ No.\ 2    %'
  78. .ce 0
  79. .sp 1P
  80. .ce 1000
  81. \fI(Geneva, 1980; modified at\fR \fIMalaga\(hyTorremolinos, 1984; Melbourne, 
  82. 1988)\fR 
  83. .sp 9p
  84. .RT
  85. .ce 0
  86. .sp 1P
  87. .ce 1000
  88. \fI(Quoted in Recommendation P.80)\fR 
  89. .ce 0
  90. .sp 1P
  91. .ce 1000
  92. (Contribution from British Telecom)
  93. .ce 0
  94. .sp 1P
  95. .LP
  96. \fB1\fR     \fBIntroduction\fR 
  97. .sp 1P
  98. .RT
  99. .PP
  100. This Supplement gives brief descriptions of the methods for assessing telephony 
  101. transmission performance that are recommended by the CCITT or have 
  102. been employed over Study Periods 1968\ to\ 1980 in studying Questions assigned 
  103. to Study Group\ XII. Some of the methods are already fully described in 
  104. Recommendations and these will merely be listed here with
  105. reference to the appropriate Recommendation. Other methods are also described 
  106. in detail elsewhere; the essential features of these are given here with 
  107. brief description of how they are conducted, with reference to descriptions
  108. published elsewhere.
  109. .RT
  110. .sp 2P
  111. .LP
  112. \fB2\fR     \fBList of methods\fR \v'3p'
  113. .sp 1P
  114. .RT
  115. .LP
  116.     a)
  117.     loudness comparison for speech
  118. (reference equivalents and loudness ratings);
  119. .LP
  120.     b)
  121.     articulation (AEN) ratings;
  122. .LP
  123.     c)
  124.     listening opinion tests;
  125. .LP
  126.     d)
  127.     conversation opinion tests;
  128. .LP
  129.     e)
  130.     quantal\(hyresponse detectability tests.
  131. .sp 2P
  132. .LP
  133. \fB3\fR     \fBBrief descriptions and references to more complete\fR 
  134. \fBdescriptions\fR 
  135. .sp 1P
  136. .RT
  137. .PP
  138. 3.1
  139. Loudness comparisons for speech are intended to quantify the
  140. relative level at which speech, transmitted over a given telephone connexion, 
  141. reaches the ears of customers while they are listening to a person talking 
  142. at the other end. In order to standardize the measuring procedure, the 
  143. talking and listening conditions are each controlled in a specified manner. 
  144. Circuit noise and room noise are excluded from the determination and so 
  145. the results are 
  146. governed by the overall mouth\(hyto\(hyear transmission loss of the speech 
  147. path being considered. The present recommended method is given in Recommendation\ 
  148. P.72 
  149. (\fIRed\ Book\fR ) and proposals for new methods are to be found in
  150. Question\ 15/XII\ [1]. More general information can be found in
  151. Reference\ [2].
  152. .sp 9p
  153. .RT
  154. .PP
  155. 3.2
  156. Articulation measurements
  157. are based on measurement
  158. of the fraction of speech sounds recognized correctly when transmitted and
  159. reproduced over the speech path in question. Circuit noise and room noise at
  160. specified levels should be present and the result is affected by their 
  161. levels. Just as for \(sc\ 3.1 above, talking and listening conditions are 
  162. controlled. The method recommended by the CCITT is described in former 
  163. Recommendation\ P.45 
  164. (\fIOrange\ Book\fR ). Other information will be found in Reference\ [2].
  165. .PP
  166. 3.3
  167. Listening opinion tests
  168. are conducted using speech
  169. material in the form of sentences and the listeners judge the speech received 
  170. over the path according to a given criterion. The method has been widely 
  171. used, and further details can be found in Reference\ [2]. 
  172. .sp 1P
  173. .LP
  174. 3.3.1
  175.     \fIMethod of conducting\fR 
  176. \fIlistening opinion tests\fR 
  177. .sp 9p
  178. .RT
  179. .PP
  180. The speech is usually recorded so that it can be reproduced at a
  181. given level. The recordings for this purpose must be carefully made and 
  182. copied so that uncontrolled degradations do not appear. Circuit noise and 
  183. room noise may be present, and their effects are taken into account. 
  184. .bp
  185. .PP
  186. Two subjective criteria commonly used are loudness preference and
  187. listening effort, for which the following scales are used.
  188. .RT
  189. .LP
  190.     \(em
  191.     Loudness preference scale
  192. :
  193. .LP
  194.     \fIOpinion scale No. 4A\fR 
  195. .LP
  196.     A
  197.     Much louder than preferred.
  198. .LP
  199.     B
  200.     Louder than preferred.
  201. .LP
  202.     C
  203.     Preferred.
  204. .LP
  205.     D
  206.     Quieter than preferred.
  207. .LP
  208.     E
  209.     Much quieter than preferred.
  210. .LP
  211.     \(em
  212.     Listening effort scale
  213. :
  214. .LP
  215.     \fIOpinion scale No. 7: Opinions based on the effort required\fR 
  216. \fIto understand the meanings of sentences\fR 
  217. .LP
  218.     A
  219.     Complete relaxation possible; no effort required.
  220. .LP
  221.     B
  222.     Attention necessary; no appreciable effort required.
  223. .LP
  224.     C
  225.     Moderate effort required.
  226. .LP
  227.     D
  228.     Considerable effort required.
  229. .LP
  230.     E
  231.     No meaning understood with any feasible effort.
  232. .PP
  233. The heading \*Q. |  |  \fIEffort required to understand the meanings of\fR 
  234. \fIsentences\fR \*U is particularly important. Without it, the other descriptions 
  235. are liable to be seriously misunderstood. 
  236. .PP
  237. \fR Experimental design is usually based on a graeco\(hylatin or
  238. hyper\(hygraeco\(hylatin square, in which rows represent listeners, columns 
  239. represent the order in which conditions are administered, symbols of the 
  240. first alphabet represent circuit conditions, and symbols of other alphabets 
  241. represent talkers and lists of sentences. Each cell of the design thus 
  242. represents a \*Qrun\*U, in 
  243. which a particular list of sentences, recorded by a particular talker, is
  244. replayed via a particular circuit condition to a particular listener at a
  245. particular position in the sequence of conditions presented to that listener. 
  246. Within each run the listening level is varied over a number of predetermined 
  247. values in random order, one value per group of five sentences, and the 
  248. subject votes on one of the above opinion scales at the end of each group. 
  249. Rarely some other parameter, such as bandwidth, is varied within each run 
  250. instead of 
  251. listening level.
  252. .PP
  253. \fR In listening\(hyeffort tests, listeners are specially prone to what
  254. is known as the \*Qenhancement\*U effect: that is, their standards of judgement 
  255. are liable to be strongly influenced by the range of quality and listening 
  256. level 
  257. occurring in the same test, and especially within the same run. It is therefore 
  258. important that the circuit conditions chosen should not include too many 
  259. bad ones (that is, conditions that will yield a poor listening\(hyeffort score
  260. even with the best listening levels), that every run should cover a range of
  261. listening levels from well above optimum to at least 30\ dB below optimum, 
  262. and that within each run at least one group of sentences should be heard 
  263. via an 
  264. \*Qanchor\*U condition (a good condition with a good listening level). 
  265. It is also important that groups and lists of sentences should not vary 
  266. too widely in 
  267. their intrinsic comprehensibility, and that no subject should hear the same
  268. sentence more than once in the same experiment, because the listening effort
  269. needed to understand a familiar sentence would obviously be reduced.
  270. .PP
  271. \fR The votes using the above scales are scored respectively 4, 3, 2, 1
  272. and\ 0: the mean of these values for each circuit condition is called \*Q
  273. mean  opinion score
  274. \*U. The opinion scores are processed by analysis of variance in order 
  275. to verify that the effects due to circuit condition, listening levels, 
  276. talkers, listeners and other factors are as expected, to determine their
  277. significance, and to evaluate confidence intervals. It is usual to express 
  278. the relationship between listening level and loudness\(hypreference mean 
  279. opinion score (scale\ 4A) by fitting an equation describing a straight 
  280. line or logistic curve, whereas the relationship between listening level 
  281. and listening\(hyeffort mean 
  282. opinion score (scale\ 7) is expressed by a fitted quadratic or more complicated 
  283. equation; other features of the circuit conditions may also enter as parameters 
  284. into these equations. 
  285. .PP
  286. Listening tests
  287. using sentence material can also be conducted as pair\(hycomparisons, but 
  288. these should be undertaken with due consideration to ensure that subjects 
  289. become suitably adapted to each test 
  290. condition.
  291. .bp
  292. .RT
  293. .PP
  294. 3.4 \fR Conversation tests may be conducted either as interviews
  295. after real customers have made actual calls or as laboratory tests. Further
  296. information regarding methods recommended by the CCITT for the former is 
  297. given in Recommendation\ P.82. Laboratory conversation tests are intended 
  298. as far as 
  299. possible to reproduce under laboratory conditions the actual service conditions 
  300. experienced by telephone customers: to this end it is necessary to choose 
  301. the circuit conditions and subjects suitably, and to administer the tests 
  302. in an 
  303. appropriate manner. A method intermediate between field observations and
  304. laboratory tests is that used by the AT&T and called SIBYL (see also
  305. Reference\ [3]). Particulars of the method used by British Telecom
  306. are given below.
  307. .sp 1P
  308. .LP
  309. 3.4.1
  310.     \fIMethod for conducting\fR 
  311. \fIconversation tests\fR 
  312. .sp 9p
  313. .RT
  314. .PP
  315. The need for careful and exhaustive preparations cannot be too
  316. strongly emphasized. It will be obvious to all that the connexions must be
  317. correctly specified and set up, and measured accurately before and after 
  318. each experiment; that auxiliary facilities such as dialling and ringing 
  319. must be 
  320. provided, so that any of the desired connections can be chosen and established 
  321. quickly and without error; and that faithful records of the output of each 
  322. test must be kept. But some other equally important considerations are 
  323. less 
  324. obvious. The following gives an outline of a system that takes all these
  325. matters into account, and has been found satisfactory in British
  326. Telecom.
  327. .RT
  328. .sp 1P
  329. .LP
  330. 3.4.1.1
  331.     \fIExperimental design\fR 
  332. .sp 9p
  333. .RT
  334. .PP
  335. The most suitable designs are of the \fIn\fR \ \(mu\ \fIn\fR  | raeco\(hylatin
  336. square type, where each of \fIn\fR \ pairs of subjects carries out one 
  337. conversation on each of \fIn\fR \ circuit conditions. Precision is very 
  338. low if\ \fIn\fR is less 
  339. than\ 8; at the other extreme it is not practical to expect subjects to 
  340. attend on more than four occasions, or to carry out more than four conversations 
  341. per visit. Moreover, the total number of conversations, \fIn\fR \ \(mu\ 
  342. \fIn\fR , increases much more rapidly than\ \fIn\fR . For this reason,\ 
  343. \fIn\fR is normally limited to the range\ 8 to\ 15 inclusive: graeco\(hylatin 
  344. squares (with symbols from two alphabets) exist for all these numbers. 
  345. In such a design, the convention is that rows denote 
  346. pairs of subjects; columns denote the order of administering the experiment;
  347. symbols of the first alphabet denote circuit conditions (distinguished 
  348. not only according to properties of the connections by themselves, but 
  349. also according to room noise levels and any other \*Qtreatment\*U factors); 
  350. symbols of the second 
  351. alphabet denote sets of pictures used as the topic of conversation. No further
  352. .PP
  353. orthogonal factors can be incorporated at all where \fIn\fR \ =\ 10, 14 
  354. or\ 15, nor by any simple method when \fIn\fR \ =\ 12; but where \fIn\fR 
  355. \ =\ 8, 9, 11 or\ 13, it is possible to construct hyper\(hygraeco\(hylatin 
  356. squares with symbols from (\fIn\fR \ \(em\ 3) additional alphabets, which 
  357. may be used to govern further orthogonal factors (such as 
  358. selection of carbon microphones, choice of calling party, or choice of
  359. crosstalk recording), for each conversation. When the square is not
  360. hyper\(hygraeco\(hylatin these factors must be allocated by some simple 
  361. balanced 
  362. rotation scheme, but this may give rise to biases that cannot be eliminated
  363. from the results. For this reason the recommended value of\ \fIn\fR is 
  364. now\ 13 rather than\ 12 as previously. 
  365. .PP
  366. To the basic square is added an extra column at the beginning, having the 
  367. same circuit condition and the same picture set for all pairs of subjects. 
  368. This column represents a preliminary conversation for each pair of subjects, 
  369. which serves to accustom them to the procedure, and to some extent stabilizes 
  370. their standards of judgement. Thus each of the\ \fIn\fR pairs of subjects 
  371. carries 
  372. out (\fIn\fR \ +\ 1) conversations altogether. The results from the preliminary
  373. conversations are not included in the main part of the analysis of results, 
  374. but are analyzed separately. Using the same preliminary circuit condition 
  375. in 
  376. different experiments establishes some common ground between experiments, 
  377. but if precise comparisons between results from different experiments are 
  378. desired, care must be taken to include replications of several standard 
  379. circuit 
  380. conditions in each such experiment.
  381. .RT
  382. .sp 1P
  383. .LP
  384. 3.4.1.2
  385.     \fIChoice of circuit conditions\fR 
  386. .sp 9p
  387. .RT
  388. .PP
  389. Circuit conditions between which particularly precise comparisons are desired 
  390. must be included within the same experiment. 
  391. .PP
  392. \fR Besides this it is necessary that all subjects in every experiment
  393. should experience more or less the whole range of performance levels: that 
  394. is, there should be at least one very good circuit condition, one of near 
  395. average performance, and one very poor one, while the rest should not all 
  396. cluster too closely about the same mean opinion score value. If one cannot 
  397. .bp
  398. .PP
  399. be
  400. confident of
  401. this beforehand, it is advisable to carry out first a short informal test on
  402. the proposed set of circuit conditions, in order to find out whether the 
  403. range is in fact covered; if not, the selection of conditions should be 
  404. modified 
  405. accordingly, otherwise the subjects' opinion scale will be distorted (the
  406. \*Qenhancement\*U effect). Extra circuit conditions, not in themselves 
  407. of direct 
  408. interest to the experimenter, may be added to bring up the number to\ 9, 11
  409. or\ 13, and to balance the range of performance more effectively.
  410. .PP
  411. \fR Subjects generally expect to experience circuit conditions with
  412. various values of overall loss or sensitivity, which of course has a very
  413. strong influence on performance, and can be varied to provide the required
  414. range of circuit conditions. There are also important interactions between
  415. overall sensitivity and many other degradations. It is therefore highly
  416. desirable, even if overall sensitivity and its interactions are not the main
  417. objects of the investigation, to include some conditions differing from each
  418. other only in overall sensitivity.
  419. .PP
  420. If the investigation cannot be confined to 15 conditions, it is then spread 
  421. over several experiments, each concentrating on a well defined 
  422. part of the inquiry but overlapping the others so as to provide common
  423. ground.
  424. .RT
  425. .sp 1P
  426. .LP
  427. 3.4.1.3
  428.     \fIEligibility of subjects\fR 
  429. .sp 9p
  430. .RT
  431. .PP
  432. Subjects taking part in the conversation tests are chosen at random from 
  433. the Research Centre personnel, with the provisons that: 
  434. .RT
  435. .LP
  436.     a)
  437.     they have not been directly involved in work connected
  438. with assessment of the performance of telephone circuits;
  439. and
  440. .LP
  441.     b)
  442.     they have not participated in any subjective test
  443. whatever for at least the previous six months, and not in a
  444. conversation test for at least one year.
  445. .PP
  446. No steps are taken to balance the numbers of male and female
  447. subjects unless the design of the experiment requires it. Subjects are
  448. arbitrarily paired in the experimental design prior to the test and remain 
  449. thus paired for its duration. 
  450. .sp 1P
  451. .LP
  452. 3.4.1.4
  453.     \fIEnvironment\fR 
  454. .sp 9p
  455. .RT
  456. .PP
  457. Subjects are seated in separate 
  458. sound\(hyproof cabinets
  459. near the point from which the experiment is controlled. Room noise is fed 
  460. in with 
  461. the required spectrum (usually the 
  462. Hoth spectrum
  463. ) at the required level (usually 50\ dBA), measured with a Bruel and Kjaer 
  464. Precision Sound Level Meter type\ 2206, used with the \*Q 
  465. \fIA\fR weighting
  466. \*U and the \*Qfast\*U meter
  467. characteristic. If different conversations in the same experiment require
  468. different room noise levels, then care is taken to prevent the transitions 
  469. from being too obvious to the subjects: ideally, room noise should be changed 
  470. only when subjects are out of the sound\(hyproof rooms. 
  471. .RT
  472. .sp 1P
  473. .LP
  474. 3.4.1.5
  475.     \fIMethods of establishing the connection\fR 
  476. .sp 9p
  477. .RT
  478. .PP
  479. The telephone sets used by the subjects are normal in appearance
  480. and feel \(em usually identical to the standard British Telecom
  481. Telephone No.\ 706, unless the experiment specifically concerns handsets of
  482. other types. The means of establishing telephone contact between subjects is
  483. made as realistic as possible. The calling subject, on lifting the handset,
  484. obtains dialling tone, and has to dial or key a prescribed number to obtain 
  485. the connection. Ringing tone occurs after a suitable fixed delay, and the 
  486. other 
  487. party's bell or tone\(hycaller is operated after a further fixed delay. Wrong
  488. numbers are rewarded by the \*QNumber Unobtainable\*U tone.
  489. .RT
  490. .sp 1P
  491. .LP
  492. 3.4.1.6
  493.     \fIConversation task\fR 
  494. .sp 9p
  495. .RT
  496. .PP
  497. Every effort is made to ensure that conversations are purposeful, and that 
  498. subjects have full opportunity to exploit the transmission 
  499. capabilities of the test circuit. A task involving sorting pictures into an
  500. order of merit has been found suitable for this purpose and sufficiently
  501. interesting to the subjects. The pictures, covering a wide variety of topics, 
  502. are samples of the standard postcard\(hysized illustrations offered for 
  503. sale at 
  504. several different museums, art galleries and similar institutions. These 
  505. cards are individually numbered on the back, and assembled arbitrarily 
  506. into sets of six cards each, every set having an exact duplicate. 
  507. .bp
  508. .PP
  509. The subject is instructed to consider these pictures for display in
  510. a public place, and, before each conversation, to arrange the cards of a
  511. particular set in his personal order of preference for this purpose; the 
  512. other subject does the same with his copy of the same set. When contact 
  513. is 
  514. established via the test circuit, the subjects have to negotiate an agreed
  515. .PP
  516. order of preference and write this down at the end of the conversation. The
  517. duration of each conversation is thus determined by the subjects themselves.
  518. Occasionally a conversation may be very long because both subjects are
  519. intensely interested in the pictures, or\ \(em as happens in less than\ 1% of
  520. cases\ \(em very short because both have independently chosen the same order of
  521. preference and have little to discuss, but even in these cases it is highly
  522. desirable to allow the subjects to decide for themselves how long to converse. 
  523. After the end of the conversation they express independent opinions of 
  524. the 
  525. connection by marking a form provided: one version of this form is reproduced 
  526. in Annex\ A. 
  527. .PP
  528. Some variations of the task (such as numbering the same pictures
  529. differently for the two subjects) have been explored, but none has been
  530. definitively adopted. No other type of task has been found to have any 
  531. greater advantages for the purpose, though several types have been tried. 
  532. .RT
  533. .sp 1P
  534. .LP
  535. 3.4.1.7
  536.     \fIPreparations for an\fR n\ \(mu\ n \fIexperiment\fR 
  537. .sp 9p
  538. .RT
  539. .PP
  540. From a list of all subjects available, the experimenter randomly
  541. chooses a sufficient number of those eligible according to the criteria 
  542. given in \(sc\ 3.4.1.3 above. He contacts these by telephone to ask whether 
  543. they are 
  544. willing to participate at certain times, which have to be arranged in
  545. such a way that subjects who converse together on their first visit remain
  546. paired for their subsequent visits in the same experiment. A standard letter 
  547. is sent to each subject, confirming the time and place of each appointment, 
  548. and 
  549. explaining in some detail what will be required of the subjects in the
  550. experiment: the text of a typical letter is reproduced in Annex\ B.
  551. .PP
  552. The experimenter prepares schedules, based on the experimental
  553. design, showing in what order conditions must be administered to each pair 
  554. of subjects, with which picture sets, which party initiates the call in 
  555. each case, and any other necessary details. Space is left for filling in 
  556. information that 
  557. .PP
  558. becomes available as the experiment proceeds: consecutive conversation 
  559. number, duration of conversation, identity of tape reel used for recording, 
  560. comments 
  561. about faults or unusual events, and so on. Opinion forms (Annex\ A) are also
  562. prepared for each conversation. However, in order to avoid duplicating or
  563. altering too many entries, some items are not filled in until they are 
  564. certain: for example, the actual names of the subjects are liable to change 
  565. until they actually arrive for their first visit. 
  566. .PP
  567. Both in the letter and in any discussions with the subjects, great
  568. care is taken not to communicate to the subjects any knowledge about the 
  569. nature of the circuit conditions. The opinion forms do not even carry any 
  570. number or 
  571. code identifying the circuit condition\ \(em this information is obtained 
  572. from the schedule and added to the forms after they have been collected 
  573. from the 
  574. subjects.
  575. .RT
  576. .sp 1P
  577. .LP
  578. 3.4.1.8
  579.     \fIProcedure\fR 
  580. .sp 9p
  581. .RT
  582. .PP
  583. When subjects arrive for their first visit, they are asked whether they 
  584. have read and understood the letter. Any obscurities are clarified, and 
  585. opportunity is given for asking questions. The sound\(hyproof rooms and their
  586. facilities are demonstrated. Subjects are informed how many calls will be
  587. comprised in this visit. Forms are handed to the subjects, and they are then
  588. left to prepare for the preliminary conversation. On subsequent visits the
  589. subjects are merely informed that the procedure will be the same as before,
  590. with possibly a different number of calls.
  591. .PP
  592. At the beginning of each conversation, the subjects take out the
  593. specified picture set from a box on the desk, arrange the pictures in order 
  594. of preference, and fill in the appropriate part of the opinion form. When 
  595. both 
  596. subjects have done this, the experimenter gives one of them the signal to
  597. initiate the call. The subjects are then completely free to determine the
  598. course of the conversation, except that they must not discuss their opinions 
  599. of the connection. When they have written down their agreed order of preference 
  600. for the pictures, terminated the conversation, and recorded their scores
  601. .PP
  602. (Excellent, Good, Fair, Poor or Bad) and their answer to the \*QDifficulty\*U
  603. question (Yes or No), the experimenter contacts each in turn by telephone to
  604. ask what answer he has given to the \*QDifficulty\*U question; if the answer is
  605. \*QYes\*U, the experimenter asks the subject to explain briefly (in his 
  606. own words) the nature of the difficulty. The reply is noted, but neither 
  607. the subject nor the experimenter is expected to attempt precise formulations: 
  608. it is essential not to prompt the subjects, and in any case the classification 
  609. of difficulty 
  610. has been found far less useful than the undifferentiated percentage
  611. \*QDifficulty\*U itself.
  612. .bp
  613. .PP
  614. After this the experimenter requests the subject to put away the form in 
  615. an envelope provided, and then tells him to start sorting out the next 
  616. set of pictures, or, as the case may be, to wait to be released from the 
  617. sound\(hyproof room.
  618. .PP
  619. Both the conversations between subjects and the conversations between experimenter 
  620. and subject are tape\(hyrecorded. 
  621. .RT
  622. .sp 1P
  623. .LP
  624. 3.4.1.9
  625.     \fITreatment of results\fR 
  626. .sp 9p
  627. .RT
  628. .PP
  629. The results from each conversation comprise two opinions on the
  630. scale Excellent\(hyGood\(hyFair\(hyPoor\(hyBad (scored respectively\ 4, 
  631. 3, 2, 1,\ 0), two 
  632. votes on the Difficulty scale (scored\ 1\ =\ Yes, 0\ =\ No), two speech levels
  633. (measured from tape recordings) and one value of duration. In particular 
  634. cases information may be collected about other variables also; for example, 
  635. video 
  636. recordings may be made in order to observe how subjects hold their
  637. handsets.
  638. .PP
  639. Analysis of variance is applied separately to each variate (opinion
  640. score, speech level,\ etc.) in order to test the significance of
  641. circuit\(hycondition features and other effects, and to find confidence 
  642. intervals for the means. With a binary variate like \*QDifficulty\*U this 
  643. process must be 
  644. regarded with some reservations. There is usually less scope for curve\(hyfitting 
  645. than in listening experiments, simply because there are far fewer pairs 
  646. of 
  647. coordinate values available.
  648. .RT
  649. .sp 1P
  650. .LP
  651. 3.5
  652.     \fIQuantal\(hyresponse detectability tests\fR 
  653. .sp 9p
  654. .RT
  655. .PP
  656. The best method for obtaining information on the detectability of some 
  657. analogous property of a sound (such as echo), as a function of some 
  658. objective quantity (such as listening level), is a quantal\(hyresponse method
  659. similar in principle to that mentioned in \(sc\ 3.1 above for loudness 
  660. balancing. The main difference is that the subject's response is not a 
  661. decision in the 
  662. form \*QReference\*U or \*QTest\*U (the designation of the louder of two 
  663. circuits), but a vote on a scale such as: 
  664. .RT
  665. .LP
  666.     \fIOpinion scale 6A\fR 
  667. .LP
  668.     A
  669.     Objectionable
  670. .LP
  671.     B
  672.     Detectable
  673. .LP
  674.     C
  675.     Not detectable
  676. .LP
  677. where B is understood to mean \*QDetectable but not objectionable\*U.
  678. .PP
  679. \fR 
  680. Scales of this sort, usually with three points, may be used in a variety 
  681. of quantal\(hyresponse tests; for example the scale as shown above may 
  682. be used where the stimulus is echo, reverberation, sidetone, voice\(hyswitching 
  683. mutilation, or interfering tones, while crosstalk and perhaps echo in some
  684. circumstances may be judged on the scale Intelligible\ \(em Detectable\ 
  685. \(em Not 
  686. detectable.
  687. .PP
  688. It is sometimes permissible to regard these votes as opinion scores, with 
  689. values 2, 1, 0 respectively, and treat them in the same sort of way as 
  690. one would treat listening or conversation opinion scores. But this is often 
  691. unsatisfactory because the decisions on such a scale as\ 6A are not really
  692. equivalents of responses on a continuous scale\ \(em as votes on such scales 
  693. as\ 4A may be legitimately taken to be\ \(em but effectively embody two 
  694. distinct 
  695. dichotomies (for example detectable/not detectable and objectionable/not
  696. objectionable), which though not independent may nevertheless call different
  697. .PP
  698. psychological processes into action: in other words, Objectionability or
  699. Intelligibility differs in kind, not merely in degree, from Detectability, 
  700. and often has a different standard deviation. For this reason a more profitable 
  701. method of analysis is to express the probability of response according 
  702. to each dichotomy separately, as a function of some objective variable, 
  703. by fitting 
  704. probit or logit equations, and then using the quantiles or other parameters 
  705. as a basis of comparison between circuit conditions, in a manner analogous 
  706. to that used in applying articulations scores. 
  707. .PP
  708. The actual conduct of experiments of this type resembles that of
  709. listening\(hyeffort tests (see \(sc\ 3.3.1\ above), but there are some 
  710. differences. In particular it is advisable that the first presentation 
  711. of the signal in each 
  712. run should be at a high listening level, so that the listener is left in no
  713. doubt what kind of signal is a candidate for his decisions. Where sidetone 
  714. or echo is involved, the subject will be required to talk as well as listen. 
  715. .PP
  716. \fR Simple audiometric measurements, as described in Recommendation\ P.78, 
  717. are usually performed on subjects who participate in these experiments, 
  718. so that results can be expressed relative to their threshold of hearing. 
  719. .bp
  720. .PP
  721. \fR For examples of the application of these techniques, see
  722. References\ [4] and\ [5].
  723. .PP
  724. Noise and other disturbances are sometimes investigated by means
  725. of responses on a scale with many more points; for example, Opinion scale\ 5
  726. with seven points ranging from \*QInaudible\*U to \*QIntolerable\*U. These 
  727. scales are more nearly of the quantized\(hycontinuum type, like Opinion 
  728. scale\ 4A, and can be treated similarly. 
  729. .RT
  730. .sp 2P
  731. .LP
  732. \fB4\fR \fBRecommendations and other CCITT studies relying on Methods a) 
  733. to e) of \(sc\ 2 above:\fR \v'3p' 
  734. .sp 1P
  735. .RT
  736. .LP
  737.     a)
  738.     Many Recommendations include requirements based originally
  739. on reference equivalents, later on corrected reference
  740. equivalents, and more recently on loudness ratings of which
  741. Recommendations\ P.12 (\fIOrange\ Book\fR ), G.101\ [6], G.103\ [7],
  742. G.111\ [8], G.120\ [9] and G.121\ [10] are examples.
  743. .LP
  744.     b)
  745.     Recommendation\ P.12 used to require certain articulation
  746. values to be satisfied but the method is now mainly used for
  747. diagnostic purposes. See Recommendation\ P.45.
  748. .LP
  749.     c)
  750.     Various Questions, for example Question 4/XII [11],
  751. Question\ 14/XII\ [12] and Supplement\ No.\ 3 at the end of this
  752. fascicle.
  753. .LP
  754.     d)
  755.     Various Questions, for example Question 4/XII [11],
  756. Question\ 9/XII\ [13], Ques
  757. tion\ 14/XII\ [12] and
  758. Supplement\ No.\ 3 at the end of this fascicle.
  759. .LP
  760.     e)
  761.     Various Questions, for example Question\ 9/XII\ [13] and
  762. References\ [14], [15] and\ [16].
  763. .sp 2P
  764. .LP
  765. \fB5\fR     \fBGeneral comments on subjective methods used in the laboratory\fR 
  766. .sp 1P
  767. .RT
  768. .PP
  769. \fR More detailed information on the conduct of subjective tests and interpretation 
  770. of their results are given in Recommendation\ P.74 and 
  771. Reference\ [2]. A rather broad survey of the relationship between various
  772. methods is given in Reference\ [17].
  773. .PP
  774. When used to provide information to assist in transmission planning
  775. of telephone networks, subjective methods should be employed with the following 
  776. considerations in mind: 
  777. .RT
  778. .LP
  779.     a)
  780.     A clear description must be available of the type of
  781. telephone connections to which the results are to be applied.
  782. This is provided by formulating appropriate hypothetical
  783. reference connections (HRCs) (see Recommendation\ G.103\ [7]).
  784. .LP
  785.     b)
  786.     The levels, transmission losses, sending and receiving
  787. reference equivalents,\ etc., of the HRCs must guide the
  788. establishment of laboratory arrangements and the conduct of the
  789. tests. Speech spectra and levels must be properly chosen to
  790. correspond to those at the various points in the\ HRC.
  791. .LP
  792.     c)
  793.     Subjects must be drawn from an appropriate population.
  794. For example, if audiograms are obtained from subjects
  795. participating in a conversation experiment, this information
  796. should not be used to reject any subjects, because the resultant
  797. bias in the sample would make the conclusions applicable only to
  798. users with a certain range of hearing sensitivity. For this
  799. reason it is safest to collect auxiliary information of this
  800. type only after the subjects have finished their main task.
  801. .LP
  802.     d)
  803.     Subjects must be treated within the experiments so that
  804. the results obtained are valid for the desired applications.
  805. This is the reason for taking the precautions described
  806. above (\(sc\ 3.3.1) to ensure that subjects' judgements are not
  807. distorted by the range of conditions and levels chosen, or by
  808. the order of presentation; and to make the procedure in
  809. conversation tests (\(sc\(sc\ 3.4.1.5 to\ 3.4.1.7) natural yet
  810. standardized.
  811. .LP
  812.     e)
  813.     Suitable experimental designs must be used so that the
  814. results can be properly analyzed and confidence intervals
  815. estimated.
  816. .LP
  817.     f
  818. )
  819.     Uncontrolled variation in some feature of the
  820. transmission path is sometimes unavoidable: for example the
  821. requirement may be to conduct a listening test over a fading
  822. radio link, or a conversation test over a TASI link with
  823. freeze\(hyout determined by real traffic. In such cases it is
  824. advisable to collect not only the subjects' responses but also
  825. contemporary information on the values of the related
  826. fluctuating quantities: signal strength in the first case,
  827. freeze\(hyout fraction or number of channels occupied in the
  828. second. The technique known as analysis of covariance
  829. (Reference\ [18]) is the appropriate method for processing this
  830. information on concomitant variables, as they are called, in
  831. conjunction with the responses (main variables).
  832. .bp
  833. .LP
  834.     g)
  835.     Even with proper precautions under c), d), e) and f),
  836. reliance should not be placed on absolute values of scores
  837. unless \*Qcontrol\*U conditions (e.g.\ a set of reference conditions)
  838. are included within the experiment. However, relativities
  839. between scores obtained from different circuit conditions within
  840. the same experiment are more reliable.
  841. .LP
  842.     h)
  843.     A set of reference conditions will make it possible
  844. to express results as ratings in terms of equivalent settings
  845. of some reference device\ \(em attenuator, noise source, modulated
  846. noise reference unit (see Recommendation\ P.81),\ etc. This
  847. enables much more reliable comparisons to be made with
  848. information from other sources.
  849. .LP
  850.     i)
  851.     Results of subjective experiments should always be
  852. reviewed for internal consistency and compared with expected
  853. results (derived from previous experience or from a theoretical
  854. model) before being applied.
  855. .sp 2P
  856. .LP
  857. \fB6\fR     \fBObjective methods\fR 
  858. .sp 1P
  859. .RT
  860. .PP
  861. Clearly the ultimate aim must be to attain the capability of
  862. assessing telephony transmission performance purely in terms of the objective 
  863. characteristics of the telephone connections concerned. This aim is partly 
  864. satisfied by use of tabulated information based on previous laboratory and
  865. other tests: an example of such usage appears in Reference\ [19].
  866. Considerable progress has now been made towards the prediction of assessment
  867. scores, speech levels,\ etc. by use of subjective modelling as described in
  868. Supplement\ No.\ 3 at the end of this fascicle and Reference\ [20]. British
  869. Telecom is now updating its tabulated information using this method.
  870. .PP
  871. \fR The modelling technique makes it possible to treat many other
  872. important features like attenuation/frequency distortion and sidetone in 
  873. a much more general manner. For example, by making due allowance for the 
  874. part played by high sidetone level\ \(em which is a very potent degradation 
  875. in connections of poor transmission performance\ \(em it makes clear why 
  876. sensible limits for 
  877. overall loss and noise cannot be fixed without regard to sidetone
  878. suppression.
  879. .RT
  880. .ce 1000
  881. ANNEX\ A
  882. .ce 0
  883. .ce 1000
  884. (to Supplement No. 2)
  885. .sp 9p
  886. .RT
  887. .ce 0
  888. .ce 1000
  889. \fBOpinion form 12A\fR 
  890. .sp 1P
  891. .RT
  892. .ce 0
  893. .LP
  894. Test\ 
  895. .sp 1P
  896. .RT
  897. .ad r
  898. Name
  899. Cabinet\ 
  900. No.\ 
  901. .sp 9p
  902. .RT
  903. .ad b
  904. .RT
  905. .sp 2P
  906. .LP
  907. 1
  908.     Before starting your call, please take out picture set\ 
  909. and
  910. arrange the cards in order of preference. Record this order in the boxes 
  911. below, using the numbers on the backs of the cards for identification. 
  912. .sp 1P
  913. .RT
  914. .LP
  915. .ce
  916. \fBH.T. [T1.2]\fR 
  917. .T&
  918. lw(48p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) , ^ 
  919. | l | l | l | l | l | l. 
  920.                         
  921.                         
  922. .T&
  923. lw(48p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) , ^ 
  924. | l | l | l | l | l | l. 
  925. Your Order of Preference    1st    2nd    3rd    4th    5th    6th
  926.                         
  927. _
  928. .TE
  929. .nr PS 9
  930. .RT
  931. .ad r
  932. \fBTable A\(hy1 [T1.2], p. \fR 
  933. .sp 1P
  934. .RT
  935. .ad b
  936. .RT
  937. .sp 1P
  938. .LP
  939. 2
  940.     If you receive a green GO AHEAD signal, then call your partner
  941. on\ 
  942. . Otherwise wait for your partner to call you.
  943. .bp
  944. .sp 9p
  945. .RT
  946. .sp 1P
  947. .LP
  948. 3
  949.      You may enter your partner's picture\(hycard order here if you find this 
  950. helps you in the discussion. 
  951. .sp 9p
  952. .RT
  953. .ce
  954. \fBH.T. [T2.2]\fR 
  955. .T&
  956. lw(48p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) , ^ 
  957. | l | l | l | l | l | l. 
  958.                         
  959.                         
  960. .T&
  961. lw(48p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) , ^ 
  962. | l | l | l | l | l | l. 
  963. Partner's Order of Preference    1st    2nd    3rd    4th    5th    6th
  964.                         
  965. _
  966. .TE
  967. .nr PS 9
  968. .RT
  969. .ad r
  970. \fBTable A\(hy2 [T2.2], p.\fR 
  971. .sp 1P
  972. .RT
  973. .ad b
  974. .RT
  975. .sp 1P
  976. .LP
  977. 4
  978.     When you have arrived at an agreed order of preference, please
  979. enter it here.
  980. .sp 9p
  981. .RT
  982. .ce
  983. \fBH.T. [T3.2]\fR 
  984. .T&
  985. lw(48p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) | lw(30p) , ^ 
  986. | l | l | l | l | l | l. 
  987.                         
  988.                         
  989. .T&
  990. lw(48p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) | cw(30p) , ^ 
  991. | l | l | l | l | l | l. 
  992. Agreed Order of Preference    1st    2nd    3rd    4th    5th    6th
  993.                         
  994. _
  995. .TE
  996. .nr PS 9
  997. .RT
  998. .ad r
  999. \fBTable A\(hy3 [T3.2], p. \fR 
  1000. .sp 1P
  1001. .RT
  1002. .ad b
  1003. .RT
  1004. .LP
  1005.     Then replace your handset.
  1006. .sp 1P
  1007. .LP
  1008. 5
  1009.      Please mark, with a cross, your opinion of the telephone connection you 
  1010. have just been using. \fIN.B.\fR \ \(em\ Please do not discuss your opinion 
  1011. with your 
  1012. partner.
  1013. .sp 9p
  1014. .RT
  1015. .ce
  1016. \fBH.T. [T4.2]\fR 
  1017. .ps 9
  1018. .vs 11
  1019. .nr VS 11
  1020. .nr PS 9
  1021. .TS
  1022. center box;
  1023. cw(36p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) .
  1024. Excellent    Good    Fair    Poor    Bad
  1025. _
  1026. .TE
  1027. .nr PS 9
  1028. .RT
  1029. .ad r
  1030. \fBTable A\(hy4 [T4.2], p. \fR 
  1031. .sp 1P
  1032. .RT
  1033. .ad b
  1034. .RT
  1035. .sp 1P
  1036. .LP
  1037. 6
  1038.      Did you or your partner have any difficulty in talking or hearing over 
  1039. the connection? 
  1040. .sp 9p
  1041. .RT
  1042. .ce
  1043. \fBH.T. [T5.2]\fR 
  1044. .ps 9
  1045. .vs 11
  1046. .nr VS 11
  1047. .nr PS 9
  1048. .TS
  1049. center box;
  1050. cw(36p) | lw(36p) .
  1051. YES    
  1052. _
  1053. .T&
  1054. cw(36p) | lw(36p) .
  1055. NO    
  1056. _
  1057. .TE
  1058. .nr PS 9
  1059. .RT
  1060. .ad r
  1061. \fBTable A\(hy5 [T5.2], p. \fR 
  1062. .sp 1P
  1063. .RT
  1064. .ad b
  1065. .RT
  1066. .LP
  1067.     If the answer is YES, please explain briefly what the difficulty
  1068. was when the operator contacts you again.
  1069. .ce
  1070. \fBH.T. [T6.2]\fR 
  1071. .T&
  1072. lw(60p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) 
  1073. | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) . 
  1074.                                                         
  1075. .T&
  1076. lw(60p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) 
  1077. | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) | lw(12p) . 
  1078. FOR R13.4 USE                                                        
  1079. _
  1080. .TE
  1081. .nr PS 9
  1082. .RT
  1083. .ad r
  1084. \fBTableau A\(hy6 [T6.2], p. \fR 
  1085. .sp 1P
  1086. .RT
  1087. .ad b
  1088. .RT
  1089. .LP
  1090. .bp
  1091. .ce 1000
  1092. ANNEX\ B
  1093. .ce 0
  1094. .ce 1000
  1095. (to Supplement No. 2)
  1096. .sp 9p
  1097. .RT
  1098. .ce 0
  1099. .ce 1000
  1100. \fB(Standard letter sent to subjects)\fR 
  1101. .sp 1P
  1102. .RT
  1103. .ce 0
  1104. .LP
  1105. Name\ 
  1106. .sp 1P
  1107. .RT
  1108. .sp 1P
  1109. .LP
  1110. Group\ 
  1111. .sp 9p
  1112. .RT
  1113. .sp 1P
  1114. .LP
  1115. R13.4 SUBJECTIVE TEST No.\ 
  1116. .sp 9p
  1117. .RT
  1118. .PP
  1119. Thank you for agreeing to take part in this experiment.
  1120. .PP
  1121. As arranged earlier by telephone, we should like you to come to
  1122. Room\ 
  1123. , Floor 3, Main Laboratory Block, at the following
  1124. times.
  1125. .RT
  1126. .LP
  1127.     Time
  1128. Day
  1129. Date
  1130. \v'6p'
  1131. .PP
  1132. On arrival, ask for 
  1133. , quoting the above subjective test number. You will be reminded by telephone 
  1134. shortly before each visit is 
  1135. due. You may book your time to project 
  1136. . If you cannot keep an
  1137. appointment, or if you need further information, contact 
  1138. on
  1139. Ipswich\ 64\ 
  1140. .
  1141. .PP
  1142. The experiment to which you have been invited forms part of a series
  1143. concerned with the transmission performance of telephone connections. You 
  1144. will be asked to converse with another volunteer over particular telephone 
  1145. connections, and it is hoped that the tasks we shall give you will lead to
  1146. vigorous conversations devoted to discussion and negotiation.
  1147. .PP
  1148. In the test room you will be provided with a set of six picture cards. 
  1149. You are asked to imagine that you and your partner are responsible for 
  1150. choosing some of these (enlarged if necessary) to be displayed in a public 
  1151. place such as the Staff Restaurant\ \(em either as items of general interest 
  1152. or simply as 
  1153. decoration. Before each call you should arrange all six cards in your order 
  1154. of preference, and write the six identification numbers in this order on 
  1155. the form provided. Your partner, in another room, will have an identical 
  1156. set of 
  1157. pictures, and his order of preference will probably be different from yours.
  1158. One of you will then be requested to make a telephone call to the other. The
  1159. aim of the ensuing conversation will be to negotiate with your partner 
  1160. so as to arrive at a compromise order which satisfies you both. At the 
  1161. end of the 
  1162. conversation you should replace the handset and enter the six numbers in the
  1163. finally agreed order on the form. You must also mark the appropriate box to
  1164. indicate your opinion of the connection. After this the operator will contact 
  1165. you and tell you what to do next. Subsequent conversations will be similar, 
  1166. but with different sets of pictures. 
  1167. .PP
  1168. In the whole experiment there will be a total of\ 
  1169. \ calls spread over the\ 
  1170. \ visit(s) arranged as above. Full instructions will be given when you 
  1171. arrive. Please bring this letter with you, and also your glasses if 
  1172. you normally wear any.
  1173. .PP
  1174. Thank you once again for your co\(hyoperation.
  1175. \v'6p'
  1176. .RT
  1177. .ad r
  1178. \ (date)
  1179. .vs +6p
  1180. .RT
  1181. .ad b
  1182. .RT
  1183. .ad r
  1184. \ (date)
  1185. .ad b
  1186. .RT
  1187. .sp 2P
  1188. .LP
  1189.     \fBReferences\fR 
  1190. .sp 1P
  1191. .RT
  1192. .LP
  1193. [1]
  1194.     CCITT\ \(em\ Question 15/XII, Contribution COM XII\(hyNo. 1, Study Period
  1195. 1981\(hy1984, Geneva,\ 1981.
  1196. .LP
  1197. [2]
  1198.     RICHARDS (D. | .): Telecommunication by speech, \fIButterworths\fR ,
  1199. London,\ 1973.
  1200. .LP
  1201. [3]
  1202.      SULLIVAN (J. | .): Is transmission satisfactory? Telephone customers 
  1203. help us decide, \fIBell Labs Record\fR , pp.\ 90\(hy98, March\ 1974. 
  1204. .LP
  1205. [4]
  1206.      RICHARDS (D. | .): Telecommunications by speech, \(sc\ 3.5.3. \fIButterworths\fR 
  1207. , London,\ 1973. 
  1208. .LP
  1209. [5]
  1210.     \fIIbid.\fR , \(sc\ 4.5.1.
  1211. .bp
  1212. .LP
  1213. [6]
  1214.     CCITT Recommendation \fIThe transmission plan\fR , Vol.\ III, Rec.\ G.101.
  1215. .LP
  1216. [7]
  1217.     CCITT Recommendation \fIHypothetical reference connections\fR , Vol.\ III,
  1218. Rec.\ G.103.
  1219. .LP
  1220. [8]
  1221.     CCITT Recommendation \fILoudness ratings (LRs) in an international\fR 
  1222. \fIconnection\fR , Vol.\ III, Rec.\ G.111.
  1223. .LP
  1224. [9]
  1225.     CCITT Recommendation \fITransmission characteristics of national\fR 
  1226. \fInetworks\fR , Vol.\ III, Rec.\ G.120.
  1227. .LP
  1228. [10]
  1229.     CCITT Recommendation \fILoudness ratings (LRs) of national systems\fR ,
  1230. Vol.\ III, Rec.\ G.121.
  1231. .LP
  1232. [11]
  1233.     CCITT\ \(em\ Question 4/XII, Contribution COM XII\(hyNo.\ 1, Study Period
  1234. 1985\(hy1988, Geneva,\ 1985.
  1235. .LP
  1236. [12]
  1237.     CCITT\ \(em\ Question 14/XII, Contribution COM XII\(hyNo.\ 1, Study Period
  1238. 1985\(hy1988, Geneva,\ 1985.
  1239. .LP
  1240. [13]
  1241.     CCITT\ \(em\ Question 9/XII, Contribution COM XII\(hyNo.\ 1, Study Period
  1242. 1981\(hy1984, Geneva,\ 1981.
  1243. .LP
  1244. [14]
  1245.     RICHARDS (D. | .) and BUCK (G. | .): Telephone echo tests, \fIP.I.E.E.\fR ,
  1246. 107B, pp.\ 553\(hy556,\ 1960.
  1247. .LP
  1248. [15]
  1249.     CCITT\ \(em\ Contribution COM XII\(hyNo.\ 171, Study Period 1977\(hy1980,
  1250. Geneva,\ 1979.
  1251. .LP
  1252. [16]
  1253.     CCITT\ \(em\ Contribution COM XII\(hyNo.\ 132, Study Period 1977\(hy1980,
  1254. Geneva,\ 1979.
  1255. .LP
  1256. [17]
  1257.     CCITT\ \(em\ Question 7/XII, Annex\ 1, Contribution COM XII\(hyNo.\ 1, Study
  1258. Period 1981\(hy1984, Geneva,\ 1981.
  1259. .LP
  1260. [18]
  1261.      SNEDECOR (G. | .) and COCHRAN (W. | .): Statistical methods, Chapter\ 
  1262. 14, 6th edition, \fIIowa State University Press\fR , 1967. 
  1263. .LP
  1264. [19]
  1265.     CCITT\ \(em\ Contribution COM XII\(hyNo.\ 173, Study Period
  1266. 1977\(hy1980, Geneva, 1979.
  1267. .LP
  1268. [20]
  1269.     RICHARDS (D. | .): Calculation of opinion scores for telephone
  1270. connections, \fIProc. IEE\fR , 121, pp.\ 313\(hy323,\ 1974.
  1271. .sp 2P
  1272. .LP
  1273.     \fBBibliography\fR 
  1274. .sp 1P
  1275. .RT
  1276. .LP
  1277. BRAUN (K.): Die Bezugsd\*:ampfung und ihre Berechnung aus der
  1278. Restd\*:ampfungskurve (Frequenzkurve) eines \*:Ubertragungssystems;
  1279. \fIT.F.T.\fR , Vol.\ 28, pp.\ 311\(hy318, August\ 1939.
  1280. .LP
  1281. BRAUN (K.): Theoretische und experimentelle Untersuchung der
  1282. Bezugsd\*:ampfung und der Lautst\*:arke; \fIT.F.T.\fR , Vol.\ 29,
  1283. pp.\ 31\(hy37, No.\ 2, 1940.
  1284. .LP
  1285. BLYE (P. | .), COOLIDGE (O. | .) and HUNTLEY (H. | .): A revised
  1286. telephone transmission rating plan; \fIB.S.T.J.\fR , Vol.\ 34,
  1287. pp.\ 453\(hy472, May\ 1955 (reproduced in the \fIRed\ Book\fR , Vol.\ I,\fR 
  1288. pp.\ 636\(hy651, ITU, Geneva,\ 1957, and Vol.\ V, pp.\ 607\(hy624, ITU,
  1289. Geneva,\ 1962).
  1290. .LP
  1291. BRAUN (K.): Image attenuations of microphone and receiver insets;
  1292. \fIN.T.Z.\fR , No.\ 8, pp.\ 365\(hy370, 1960 (translated in the \fIRed\ 
  1293. Book\fR , 
  1294. Vol.\ V | fIbis\fR , pp.\ 255\(hy265, ITU, Geneva,\ 1965).
  1295. .LP
  1296. FRENCH (N. | .) and STEINBERG (J. | .): Factors governing the
  1297. intelligibility of speech sounds; \fIJ.A.S.A.\fR , Vol.\ 19, p.\ 89,
  1298. Jan.\ 1947.
  1299. .LP
  1300. RICHARDS (D. | .) and ARCHBOLD (R. | .): A development of the Collard
  1301. principle of articulation calculation; \fIP.I.E.E.\fR , Vol.\ 103, Part\ B,
  1302. Sept.\ 1956 (\fIRed\ Book\fR , Vol.\ I, Question\ 7 of Study Group\ 12, 
  1303. Annex\ 4, ITU, 
  1304. Geneva,\ 1956).
  1305. .LP
  1306. Contribution by the Italian Administration to the study of objective
  1307. methods for measuring reference equivalent and articulation reference
  1308. equivalent, \fIRed\ Book\fR , Vol.\ I, Question\ 7 of Study Group\ 12, 
  1309. Annex\ 3, ITU, 
  1310. Geneva,\ 1956.
  1311. .LP
  1312. FLETCHER (H.) and GALT (R. | .): The perception of speech and its
  1313. relation to telephony; \fIJ.A.S.A.\fR , Vol.\ 22, p.\ 89, March\ 1950
  1314. (reproduced in the following work, Chapters\ 15\(hy17).
  1315. .LP
  1316. FLETCHER (H.): Speech and hearing in communication, \fID. Van\fR \fINostrand\fR 
  1317. , New York,\ 1953. 
  1318. .LP
  1319. Tonality method studied by the U.S.S.R. Administration to determine
  1320. articulation; \fIRed\ Book\fR , Vol.\ V, Part\ II, Annex\ 31, ITU, Geneva,\ 
  1321. 1962. 
  1322. .LP
  1323. Method used by the Swiss Telephone Administration for the determination
  1324. of transmission quality based on objective measurements; \fIRed\ Book\fR ,
  1325. Vol.\ V, Part\ II, Annex\ 30, ITU, Geneva,\ 1962.
  1326. .LP
  1327. LALOU (J.): Calculation of telephone transmission performance by
  1328. information theory, \fIRed\ Book\fR , Vol.\ V | fIbis\fR , Question\ 7/XII, 
  1329. Annex\ 2, ITU, 
  1330. Geneva,\ 1965.
  1331. .bp
  1332. .LP
  1333. SIVIAN (L. | .): Speech power and its measurement,
  1334. \fIB.S.T.J.\fR , 8, pp.\ 646\(hy661,\ 1929.
  1335. .LP
  1336. LOYE (D. | .) and MORGAN (K. | .): Sound picture recording and
  1337. reproducing characteristics, \fIJ. Soc. Motion Picture Engineers\fR ,
  1338. 32, pp.\ 631\(hy647, 1939.
  1339. .LP
  1340. RICHARDS (D. | .): Some aspects of the behaviour of telephone users
  1341. as affected by the physical properties of the circuit. Communication
  1342. Theory, \fIButterworths Scientific Publications\fR , pp.\ 442\(hy449,\ 1953.
  1343. .LP
  1344. ZAITSEV (T. | .): Correlation method for determining the fidelity and
  1345. intelligibility of speech transmitted over telecommunication channels,
  1346. \fIElektrosvyaz\fR , 10, pp.\ 38\(hy46, 1958.
  1347. .LP
  1348. LICKLIDER (J. | . | .), BISBERG (A.) and SCHWARZLANDER (H.): An
  1349. electronic device to measure the intelligibility of speech, \fIProc. Nat.\fR 
  1350. \fIElectronics Conf.\fR , 15, pp.\ 329\(hy334, 1959.
  1351. .LP
  1352. RICHARDS (D. | .) and SWAFFIELD (J.): Assessment of speech
  1353. communication links, \fIP.I.E.E.\fR , 106B, pp.\ 77\(hy89,\ 1959.
  1354. .LP
  1355. RICHARDS (D. | .): Conversation performance of speech links subject
  1356. to long propagation times, International Conference on Satellite
  1357. Communication, \fIInst. Elec. Engrs.\fR , pp.\ 247\(hy251, London,\ 1962.
  1358. .LP
  1359. RICHARDS (D. | .): Transmission performance of telephone connections
  1360. having long propagation times, \fIHet PTT\(hyBedrijf\fR , 15,
  1361. pp.\ 12\(hy24, 1967.
  1362. .LP
  1363. BOERYD, (A.): Subscriber reaction due to unbalanced transmission
  1364. levels, \fIibid\fR , pp.\ 39\(hy43.
  1365. .LP
  1366. RICHARDS, (D. | .): Distortion of speech by quantizing,
  1367. \fIElectronics Letters\fR , 3, pp.\ 230\(hy231,\ 1967.
  1368. .LP
  1369. GOLDMAN\(hyEISLER (F.): Sequential temporal patterns and cognitive
  1370. processes in speech, \fILanguage and Speech\fR , 10, pp.\ 122\(hy132, 1967.
  1371. \v'6p'
  1372. .sp 2P
  1373. .LP
  1374. \fBSupplement\ No.\ 3\fR 
  1375. .RT
  1376. .sp 2P
  1377. .ce 1000
  1378. \fBMODELS\ FOR\ PREDICTING\ TRANSMISSION\ QUALITY\ FROM\fR 
  1379. .EF '%    Volume\ V\ \(em\ Suppl.\ No.\ 3''
  1380. .OF '''Volume\ V\ \(em\ Suppl.\ No.\ 3    %'
  1381. .ce 0
  1382. .sp 1P
  1383. .ce 1000
  1384. \fBOBJECTIVE\ MEASUREMENTS\fR 
  1385. .ce 0
  1386. .sp 1P
  1387. .PP
  1388. Models for predicting the subjective opinion of telephone
  1389. connections, using data from objective measurements, are currently under 
  1390. study in Question\ 7/XII. It has not been possible up to now to recommend 
  1391. a single 
  1392. model applicable over a wide range of transmission impairments, but the 
  1393. methods described in \(sc\(sc\ 1, 2, 3, 4\ below have been proposed by 
  1394. several 
  1395. Administrations.
  1396. .sp 1P
  1397. .RT
  1398. .sp 2P
  1399. .LP
  1400. \fB1\fR \fBTransmission rating models\fR \fI(Geneva, 1980; modified at\fR 
  1401. \fIMalaga\(hyTorremolinos,\ 1984) (Quoted in \(sc\ 3 of Recommendation\ 
  1402. P.11)\fR 
  1403. (Contribution by the Bell Communications Research, Inc.
  1404. .FS
  1405. This Section
  1406. (former Supplement\ No.\ 3, \fIRed Book\fR ), reflects in part work performed 
  1407. at AT&T Bell Laboratories prior to 1\ January\ 1984. 
  1408. .FE
  1409. )
  1410. .sp 1P
  1411. .RT
  1412. .sp 1P
  1413. .LP
  1414. 1.1
  1415.     \fIIntroduction\fR 
  1416. .sp 9p
  1417. .RT
  1418. .PP
  1419. This Section describes transmission rating models which can be
  1420. used to estimate the subjective reaction of telephone customers to the
  1421. transmission impairments of circuit noise, overall loudness rating, talker
  1422. echo, listener echo, attenuation distortion (including bandwidth), quantizing 
  1423. distortion, room noise and sidetone. 
  1424. .PP
  1425. The models for circuit noise overall loudness rating (OLR) and
  1426. talker echo are based on several conversational tests conducted at Bell
  1427. Laboratories in the period from\ 1965 to\ 1972 to evaluate the subjective
  1428. assessment of transmission quality as a function of circuit noise, overall
  1429. loudness rating, talker echo path loss and talker echo path delay\ [1]. These
  1430. tests involved several hundred subjects and several thousand test calls,
  1431. Several tests were conducted on normal business calls. Others were conducted 
  1432. in the laboratory. All of the tests employed a 5\(hycategory rating scale: 
  1433. excellent, good, fair, poor and unsatisfactory. 
  1434. .bp
  1435. .PP
  1436. The essential features of the models were originally derived in terms of 
  1437. loudness loss of an overall connection \fIin dB\fR (as measured by the 
  1438. Electro\(hyAcoustic Rating System, \fIEARS\fR ) and circuit noise \fIin 
  1439. dBmp\fR at the input to a reference receiving system (electric\(hyto\(hyacoustic 
  1440. efficiency as measured by the \fIEARS\fR )\ [2]. The effects of talker 
  1441. echo were later 
  1442. incorporated in terms of loudness loss of the echo path \fIin dB\fR (as 
  1443. measured by the \fIEARS\fR ) and round trip delay of the echo path \fIin 
  1444. milliseconds\fR . 
  1445. Experimentally determined correction factors were used to convert the models 
  1446. to loudness ratings according to Recommendation\ P.79. 
  1447. .PP
  1448. The original model for listener echo was based on a series of four
  1449. listening\(hytype subjective tests conducted at Bell Laboratories in\ 1977 and
  1450. 1978\ [4]. Subsequent test results led to an alternative form of the model\ 
  1451. [5], [6]. The subjective tests included conditions in which the listener 
  1452. echo path loss was flat or frequency\(hyshaped by selective filtering. 
  1453. A weighted echo path loss is defined to provide a weighting of the frequency\(hyshaped 
  1454. test conditions so that subjectively equivalent test conditions have the 
  1455. same transmission 
  1456. rating.
  1457. .PP
  1458. The model for quantizing distortion is based on a series of five
  1459. subjective tests conducted to evaluate the performance of
  1460. various digital codec algorithms [7], [8],\ [9].
  1461. .PP
  1462. The model for bandwidth and attenuation distortion is based on tests conducted 
  1463. in\ 1978\ [10]. 
  1464. .PP
  1465. The model for room noise is based on unpublished tests conducted in
  1466. 1976. Opinion ratings of transmission quality on a five\(hycategory scale were
  1467. made by 40\ subjects for 156\ conditions having various combinations of room
  1468. noise, speech level, circuit noise and sidetone path loss. The samples 
  1469. of room noise were presented from tape recordings made in an airlines reservations 
  1470. office. A model was fitted to the test results in terms of the circuit noise
  1471. which produced the same quality ratings as given levels of room noise.
  1472. .PP
  1473. The model for sidetone is based on tests conducted in 1980 [11].
  1474. .PP
  1475. All of the tests were conducted with Western Electric 500\(hytype telephone 
  1476. sets or equivalent. The procedures used in the analysis of the subjective 
  1477. tests results and the derivation of the transmission rating scale are outlined 
  1478. in 
  1479. Reference\ [1]. Although the procedures are somewhat complex for manual
  1480. calculation, they are easily handled on a digital computer and have been 
  1481. found to provide a convenient and useful representation for a large variety 
  1482. of test data. 
  1483. .PP
  1484. The models incorporate the concept of a 
  1485. transmission rating
  1486. scale
  1487. . An important reason for the introduction of this scale was the
  1488. recognition that subjective test results can be affected by various factors
  1489. such as the subject group, the type of test, and the range of conditions 
  1490. which are included in the test. These factors have been found to cause 
  1491. changes in 
  1492. both the mean opinion score of a given condition and in the standard deviation. 
  1493. Thus, there are difficulties in trying to establish a unique relationship 
  1494. .PP
  1495. between a given transmission condition and subjective opinion in terms 
  1496. of mean opinion score or percent of ratings which are good or excellent. 
  1497. The 
  1498. introduction of a transmission rating scale tends to reduce this difficulty 
  1499. by separating the relationship between transmission characteristics and 
  1500. opinion 
  1501. ratings into two parts. The first part, the transmission rating as a function 
  1502. of the transmission characteristic, is anchored at two points and tends 
  1503. to be much less dependent on individual tests. The second part, the relationship 
  1504. between the transmission rating and subjective opinion ratings, can then be
  1505. displayed for each individual test.
  1506. .PP
  1507. The transmission rating scale for overall loudness rating and circuit noise 
  1508. was derived such that it is anchored at two points as shown in 
  1509. Table\ 1\(hy1.
  1510. .RT
  1511. .ce
  1512. \fBH.T. [T1.3]\fR 
  1513. .ce
  1514. TABLE\ 1\(hy1
  1515. .ps 9
  1516. .vs 11
  1517. .nr VS 11
  1518. .nr PS 9
  1519. .TS
  1520. center box;
  1521. cw(60p) | cw(60p) | cw(60p) .
  1522. Overall loudness rating  (dB)     {
  1523. Circuit noise
  1524. (dBmp) | ua\d\u)\d
  1525.  }    Transmission rating
  1526. _
  1527. .T&
  1528. cw(60p) | cw(60p) | cw(60p) .
  1529. 16    \(em61    80
  1530. .T&
  1531. cw(60p) | cw(60p) | cw(60p) .
  1532. 31    \(em76    40
  1533. .TE
  1534. .LP
  1535. \ua\d\u)\d
  1536. The circuit noise values are referred to a receiving system with a receiving loudness rating (RLR)\ =\ 0\ dB.
  1537. .nr PS 9
  1538. .RT
  1539. .ad r
  1540. \fBTable 1\(hy1 [T1.3],\fR 
  1541. .sp 1P
  1542. .RT
  1543. .ad b
  1544. .RT
  1545. .LP
  1546. .bp
  1547. .PP
  1548. These anchor points were selected to be well separated but within the range 
  1549. of conditions which are likely to be included in a test. The rating values 
  1550. are such that most connections will have positive ratings between\ 40 
  1551. and\ 100. Transmission ratings for other combinations of loudness rating and
  1552. circuit noise are relative to those for these two anchor points.
  1553. .PP
  1554. This Section presents the 
  1555. transmission rating models
  1556. in terms of overall loudness rating of an overall connection in dB, circuit 
  1557. noise in 
  1558. dBmp referred to the input of a receiving system with a receiving loudness
  1559. rating (RLR)\ =\ 0\ dB, loudness rating of the talker echo path in\ dB, and
  1560. round\(hytrip delay of the talker echo path in milliseconds. Annex\ A illustrates 
  1561. representative opinion results. 
  1562. .RT
  1563. .sp 2P
  1564. .LP
  1565. 1.2
  1566.     \fITransmission rating models\fR 
  1567. .sp 1P
  1568. .RT
  1569. .sp 1P
  1570. .LP
  1571. 1.2.1
  1572.     \fIOverall loudness rating and circuit noise\fR 
  1573. .sp 9p
  1574. .RT
  1575. .PP
  1576. The transmission rating model for overall loudness rating and
  1577. circuit noise is
  1578. \v'6p'
  1579. .RT
  1580. .ce 1000
  1581. \fIR
  1582. \dLN
  1583. \u\fR = \(em26.76 \(em 2.257
  1584. @ sqrt { \fIL\fR~`~\fI~\de\u\fR~\(em~8.2) \u2\d~+~1 } @  \(em  2.0294 \fIN\fR `
  1585. \fI
  1586. \dF
  1587. \u\fR + 1.751 \fIL\fR `
  1588. \fI
  1589. \de\u\fR + 0.02037
  1590. \fIL\fR `
  1591. \fI
  1592. \de\u\fR \fIN\fR `
  1593. \fI
  1594. \dF
  1595. \u\fR 
  1596. .ce 0
  1597. .ad r
  1598. (1\(hy1)
  1599. .ad b
  1600. .RT
  1601. .LP
  1602. .sp 1
  1603. .LP
  1604. where
  1605. .LP
  1606.     \fIL\fR `
  1607. \fI\fI\d\fIe\fR\u    is the OLR of an overall
  1608. telephone connection (in\ dB).
  1609. .LP
  1610.     \fIN\fR `
  1611. \fI\fI\d\fIF\fR\u is the total effective noise (in dBmp) referred to a 
  1612. receiving system with a 0\ dB RLR. The total effective noise is obtained 
  1613. by the power addition of the circuit noise, \fIN\fR ` 
  1614. \fI\fI\d\fIc\fR\u, the
  1615. circuit noise equivalent, \fIN\fR `
  1616. \fI\fI\d\fIR\fR\\d\fIe\fR\u, of the room noise and the circuit noise equivalent, 
  1617. \fIN\fR ` 
  1618. \fI\fI\d\fIQ\fR\\d\fIe\fR\u, of the
  1619. quantizing noise.
  1620. .LP
  1621.     \fIN\fR `
  1622. \fI\fI\d\fIc\fR\u    is the circuit noise (in dBmp) referred to a
  1623. receiving system with a 0\ dB RLR.
  1624. .LP
  1625.     \fIN\fR `
  1626. \fI\fI\d\fIR\fR\\d\fIe\fR\u is the circuit noise equivalent (in dBmp) of 
  1627. the room noise referred to a receiving system with a 0\ dB RLR. (See \(sc\ 
  1628. 1.2.2.) 
  1629. .LP
  1630.     \fIN\fR `
  1631. \fI\fI\d\fIQ\fR\\d\fIe\fR\u is the circuit noise equivalent (in dBmp) of 
  1632. the quantizing noise referred to receiving system with a 0\ dB RLR. (See 
  1633. \(sc\ 1.2.3.)
  1634. .PP
  1635. Transmission rating as a function of the OLR and circuit noise is shown 
  1636. in Figure\ 1\(hy1. This figure uses a value of 
  1637. \fIN\fR `
  1638. \fI\fI\d\fIR\fR\\d\fIe\fR\u\ =\ \(em58.63\ dBmp. Bandwidth factor, \fIk\fR\d\fIB\fR\\d\fIW\fR\u, 
  1639. defined in \(sc\ 1.2.4 is equal to unity. 
  1640. .sp 1P
  1641. .LP
  1642. 1.2.2
  1643.     \fICircuit noise equivalent of the room noise\fR 
  1644. .sp 9p
  1645. .RT
  1646. .PP
  1647. The transmission rating model for the circuit noise equivalent,
  1648. \fIN\fR `
  1649. \fI
  1650. \dRe
  1651. \u\fR \ (in\ dBmp), of the room noise is
  1652. \v'6p'
  1653. .RT
  1654. .ce 1000
  1655. \fIN\fR `
  1656. \fI
  1657. \dRe
  1658. \u\fR = \fIN
  1659. \dR\u\fR \(em 121 + 0.0078 (\fIN
  1660. \dR\u\fR \(em 35)
  1661. \u2\d
  1662. + 10 log
  1663. \d10
  1664. \u 
  1665. @ left [ 1~+~10~~\u { ~\(em~\fIL\fR~`~\fI~\ds\u\fR } over { 0 } \d right ] @ 
  1666. .ce 0
  1667. .ad r
  1668. (1\(hy2)
  1669. \v'7p'
  1670. .ad b
  1671. .RT
  1672. .LP
  1673. .sp 1
  1674. where
  1675. .LP
  1676.     \fIN\fR\d\fIR\fR\u    is the room noise in dB(A) at the listening end
  1677. .LP
  1678.     \fIL\fR `
  1679. \fI\fI\d\fIs\fR\u is the sidetone masking rating (in\ dB) of the listening 
  1680. end telephone set sidetone path 
  1681. .PP
  1682. The circuit noise equivalent, \fIN\fR `
  1683. \fI
  1684. \dRe
  1685. \u\fR ,  is plotted as a function of room noise in Figure\ 1\(hy2.
  1686. .PP
  1687. \fINote\fR \ \(em\ The transmission rating model for loudness rating and 
  1688. circuit noise is normally used with 
  1689. \v'6p'
  1690. .RT
  1691. .ce 1000
  1692. \fIN\fR `
  1693. \fI
  1694. \dRe
  1695. \u\fR = \(em58.63 dBmp.
  1696. .ce 0
  1697. .ad r
  1698. (1\(hy3)
  1699. .ad b
  1700. .RT
  1701. .PP
  1702. .sp 1
  1703. This value was determined from analysis of the conversational
  1704. tests results from which the transmission rating model for the overall 
  1705. loudness rating and circuit noise was originally formulated. 
  1706. .bp
  1707. .LP
  1708. .rs
  1709. .sp 24P
  1710. .ad r
  1711. \fBFigure\ 1\(hy1, p. 
  1712. .sp 1P
  1713. .RT
  1714. .ad b
  1715. .RT
  1716. .LP
  1717. .rs
  1718. .sp 23P
  1719. .ad r
  1720. \fBFigure 1\(hy2, p.\fR 
  1721. .sp 1P
  1722. .RT
  1723. .ad b
  1724. .RT
  1725. .LP
  1726. .bp
  1727. .sp 1P
  1728. .LP
  1729. 1.2.3
  1730.     \fICircuit noise equivalent of quantizing noise\fR 
  1731. .sp 9p
  1732. .RT
  1733. .PP
  1734. The transmission rating model for the circuit noise equivalent
  1735. \fIN\fR `
  1736. \fI\fI\d\fIQ\fR\\d\fIe\fR\u(in dBmp) of quantizing noise is
  1737. \v'6p'
  1738. .RT
  1739. .ce 1000
  1740. \fIN\fR `
  1741. \fI\fI\d\fIQ\fR\\d\fIe\fR\u= \fIV\fR \ \(em\ 2\ \(em\ SNR
  1742. .ce 0
  1743. .ad r
  1744. (1\(hy4)
  1745. .ad b
  1746. .RT
  1747. .LP
  1748. .sp 1
  1749. where
  1750. .LP
  1751.     \fIV\fR     is the active speech level (in dBM) referred to a receiving
  1752. system with a 0\ dB RLR,
  1753. .LP
  1754. and
  1755. .LP
  1756.     SNR
  1757.     is the signal\(hyto\(hycircuit noise ratio (in\ dB) which is
  1758. judged to provide speech quality equivalent to the
  1759. speech\(hyto\(hyspeech correlated noise ratio, \fIQ\fR (in\ dB), as
  1760. determined by a Modulated Noise Reference Unit
  1761. (see Recommendation\ P.81).
  1762. .PP
  1763. SNR can be approximated by
  1764. \v'6p'
  1765. .ce 1000
  1766. SNR = 2.36 \fIQ\fR \ \(em\ 8
  1767. .ce 0
  1768. .ad r
  1769. (1\(hy5)
  1770. .ad b
  1771. .RT
  1772. .LP
  1773. .sp 1
  1774. from which
  1775. \v'6p'
  1776. .ce 1000
  1777. \fIN\fR `
  1778. \fI\fI\d\fIQ\fR\\d\fIe\fR\u= \fIV\fR \ \(em\ 2.36 \fIQ\fR \ +\ 6
  1779. .ce 0
  1780. .ad r
  1781. (1\(hy6)
  1782. .ad b
  1783. .RT
  1784. .PP
  1785. .sp 1
  1786. Based on a 1975\(hy1976 Speech Level Survey, [12] the speech level
  1787. for domestic North American connections can be approximated by
  1788. \v'6p'
  1789. .sp 1P
  1790. .ce 1000
  1791. \fIV\fR = \(em9 \(em\ \fIL\fR `
  1792. \fI\fI\d\fIe\fR\u
  1793. .ce 0
  1794. .sp 1P
  1795. .LP
  1796. .sp 1
  1797. from which
  1798. \v'6p'
  1799. .ce 1000
  1800. \fIN\fR `
  1801. \fI\fI\d\fIQ\fR\\d\fIe\fR\u= \(em3\ \(em\ \fIL\fR `
  1802. \fI\fI\d\fIe\fR\u\ \(em
  1803. 2.36\ \fIQ\fR 
  1804. .ce 0
  1805. .ad r
  1806. (1\(hy7)
  1807. .ad b
  1808. .RT
  1809. .LP
  1810. .sp 1
  1811. .PP
  1812. Estimates of \fIQ\fR  | or single codec pairs are given below for
  1813. Pulse Code Modulation (PCM), Nearly\(hyInstantaneous Compandored modulation
  1814. (NIC), Adaptive Differential Pulse Code Modulation (ADPCM) and Adaptive
  1815. Delta Modulation (ADM). They apply to the particular algorithms described 
  1816. in References\ [7] and\ [9]. 
  1817. .ad r
  1818.     PCM:
  1819.     \fIQ\fR \ =\ 0.78\ \fIL\fR \ \(em\ 12.9
  1820. (1\(hy8)
  1821. .ad b
  1822. .RT
  1823. .ad r
  1824.         NIC:
  1825.     \fIQ\fR \ =\ 0.74\ \fIL\fR \ \(em\ \ 2.8
  1826. (1\(hy9)
  1827. .ad b
  1828. .RT
  1829. .ad r
  1830.         ADM:
  1831.     \fIQ\fR \ =\ 0.42\ \fIL\fR \ +\ \ 8.6
  1832. (1\(hy10)
  1833. .ad b
  1834. .RT
  1835. .ad r
  1836.     \fI\fR 
  1837.     ADPCM:
  1838.     \fIQ\fR \ =\ 0.98\ \fIL\fR \ \(em\ \ 5.3
  1839. (1\(hy11)
  1840. .ad b
  1841. .RT
  1842. .ad r
  1843.         ADPCM\(hyV:
  1844.     \fIQ\fR \ =\ 1.04\ \fIL\fR \ \(em\ \ 4.6
  1845. (1\(hy12)
  1846. .ad b
  1847. .RT
  1848. .LP
  1849.     
  1850. where
  1851. .LP
  1852.     \fIL\fR     is the line bit rate in kbit/s.
  1853. .PP
  1854. \fINote\fR \ \(em\ The ADPCM algorithm with fixed predictor is described 
  1855. in Reference\ [13]. The ADPCM\(hyV algorithm with adaptive predictor is 
  1856. described in Reference\ [9]. 
  1857. .PP
  1858. For connections with tandem codec pairs, the total \fIQ\fR  | an be
  1859. estimated as follows:
  1860. \v'6p'
  1861. .RT
  1862. .ce 1000
  1863. \fIQ\fR = \(em15 log
  1864. \d10
  1865. \u 
  1866. @ left [  pile { fIn\fR above sum above \fIi\fR~=1 } 10~\u\(em { fIQ~\di\u\fR } over { 5 } \d right ] @ 
  1867. .ce 0
  1868. .ad r
  1869. (1\(hy13)
  1870. \v'8p'
  1871. .ad b
  1872. .RT
  1873. .LP
  1874. .sp 1
  1875. .sp 1P
  1876. .LP
  1877. 1.2.4
  1878.     \fIBandwidth and attenuation distortion\fR 
  1879. .sp 9p
  1880. .RT
  1881. .PP
  1882. The transmission rating model for overall loudness rating and
  1883. circuit noise can be modified to include the effects of bandwidth (and
  1884. attenuation distortion). The transmission rating,
  1885. \fIR\fR \s6\fILNBW\fR .PS 10
  1886. , for overall loudness rating, circuit
  1887. noise and bandwidth is
  1888. \v'6p'
  1889. .RT
  1890. .ce 1000
  1891. \fIR\fR \s6\fILNBW\fR .PS 10
  1892. = (\fIR\fR\d\fIL\fR\\d\fIN\fR\u\ \(em\ 22.8)
  1893. \fIk\fR\d\fIB\fR\\d\fIW\fR\u\ +\ 22.8
  1894. .RT
  1895. .ce 0
  1896. .ad r
  1897. (1\(hy14)
  1898. .ad b
  1899. .RT
  1900. .LP
  1901. .sp 1
  1902. .bp
  1903. .LP
  1904. where
  1905. \v'6p'
  1906. .ad r
  1907.      \fIk\fR\d\fIB\fR\\d\fIW\fR\u\ =\ \fIk\fR\d1\u\fIk\fR\d2\u\fIk\fR\d3\u\fIk\fR\d4\u(1\(hy15) 
  1908. .ad b
  1909. .RT
  1910. .LP
  1911.     .sp 1
  1912. .LP
  1913. with
  1914. \v'6p'
  1915. .ad r
  1916.     \fIk\fR\d1\u\ =\ 1\ \(em\ 0.00148 (\fIF\fR\d\fIl\fR\u\ \(em\ 310)
  1917. (1\(hy16)
  1918. .ad b
  1919. .RT
  1920. .ad r
  1921.     
  1922.     \fIk\fR\d2\u\ =\ 1\ +\ 0.000429 (\fIF\fR\d\fIu\fR\u\ \(em\ 3200)
  1923. (1\(hy17)
  1924. .ad b
  1925. .RT
  1926. .ad r
  1927.     
  1928.      \fIk\fR\d3\u\ =\ 1\ +\ 0.0372 (\fIS\fR\d\fIl\fR\u\ \(em\ 2)\ +\ 0.00215 
  1929. (\fIS\fR\d\fIl\fR\u\ \(em\ 2)\u2\d 
  1930. (1\(hy18)
  1931. .ad b
  1932. .RT
  1933. .ad r
  1934.     
  1935.      \fIk\fR\d4\u\ =\ 1\ +\ 0.0119 (\fIS\fR\d\fIu\fR\u\ \(em\ 3)\ \(em\ 0.000532 
  1936. (\fIS\fR\d\fIu\fR\u 
  1937. \(em\ 3)\u2\d \(em 0.00336\ (\fIS\fR\d\fIu\fR\u\(em 3)\ (\fIS\fR\d\fIl\fR\u\(em 
  1938. 2) 
  1939. (1\(hy19)
  1940. .ad b
  1941. .RT
  1942. .LP
  1943.     
  1944. .sp 1
  1945. and
  1946. .LP
  1947.      \fIF\fR\d\fIl\fR\u, \fIF\fR\d\fIu\fR\u is the lower and upper band limits 
  1948. (in Hz) at which the acoustic\(hyto\(hyacoustic response is 10\ dB lower 
  1949. than the 
  1950. response at 1000\ Hz. (For \fIF\fR\d\fIu\fR\u\ >\ 3200\ Hz, a value of
  1951. 3200\ Hz should be used.)
  1952. .LP
  1953.      \fIS\fR\d\fIl\fR\u, \fIS\fR\d\fIu\fR\u is the lower and upper inband 
  1954. response slopes (in dB/octave) below and above 1000\ Hz, respectively, 
  1955. which would 
  1956. have the same loudness loss as the actual response shapes.
  1957. .PP
  1958. Figures 1\(hy3 and 1\(hy4 illustrate the effect of the band limits,
  1959. \fIF\fR\d\fIl\fR\uand \fIF\fR\d\fIu\fR\u, and inband slopes, \fIS\fR\d\fIl\fR\uand 
  1960. \fIS\fR\d\fIu\fR\u, on the bandwidth factor, \fIk\fR\d\fIB\fR\\d\fIW\fR\u. 
  1961. .PP
  1962. \fINote\fR \ \(em\ The functions for the bandwidth factor, \fIk\fR\d\fIB\fR\\d\fIW\fR\u, 
  1963. have been selected such that \fIk\fR\d\fIB\fR\\d\fIW\fR\u\ =\ 1 when \fIF\fR\d\fIl\fR\u\ 
  1964. =\ 310\ Hz, 
  1965. \fIF\fR\d\fIu\fR\u\ =\ 3200\ Hz, \fIS\fR\d\fIl\fR\u\ =\ 2\ dB/octave and 
  1966. \fIS\fR\d\fIu\fR\u\ =\ 3\ dB/octave. These 
  1967. response characteristics are rep
  1968. resentative of those used in the tests to
  1969. formulate the transmission rating model for overall loudness rating and 
  1970. circuit noise. 
  1971. .RT
  1972. .LP
  1973. .rs
  1974. .sp 28P
  1975. .ad r
  1976. \fBFigure\ 1\(hy3, p.\fR 
  1977. .sp 1P
  1978. .RT
  1979. .ad b
  1980. .RT
  1981. .LP
  1982. .bp
  1983. .LP
  1984. .rs
  1985. .sp 31P
  1986. .ad r
  1987. \fBFigure\ 1\(hy4, p.\fR 
  1988. .sp 1P
  1989. .RT
  1990. .ad b
  1991. .RT
  1992. .sp 1P
  1993. .LP
  1994. 1.2.5
  1995.     \fIListener echo\fR 
  1996. .sp 9p
  1997. .RT
  1998. .PP
  1999. The transmission rating model for listener echo is
  2000. \v'6p'
  2001. .RT
  2002. .ce 1000
  2003. \fIR
  2004. \dLE
  2005. \u\fR = 9.3 (\fIWEPL\fR + 7) (\fID
  2006. \dL\u\fR \(em 0.4)
  2007. \u\(em0.229
  2008. \d
  2009. .ce 0
  2010. .ad r
  2011. (1\(hy20)
  2012. .ad b
  2013. .RT
  2014. .LP
  2015. .sp 1
  2016. where
  2017. .LP
  2018.     \fIWEPL\fR     is the Weighted Listener Echo Path Loss (in dB)
  2019. and
  2020. \v'6p'
  2021. .ce 1000
  2022. \fIWEPL\fR = \(em20 log
  2023. \d10
  2024. \u
  2025. [Unable to Convert Formula]
  2026. @ pile { 400 above int above 200 } @ 
  2027. 10
  2028. \u\(em
  2029. @ { fIEPL\fR ( \fIf\fR ) } over { 0 } @ 
  2030. \d d
  2031. \fIf\fR 
  2032. .ce 0
  2033. .ad r
  2034. (1\(hy21)
  2035. \v'1P'
  2036. \v'2p'
  2037. .ad b
  2038. .RT
  2039. .LP
  2040. .sp 1
  2041. .LP
  2042.     \fIEPL\fR (
  2043. \fIf\fR )
  2044.     is the echo path loss (in dB) as a
  2045. function of frequency in Hz.
  2046. .LP
  2047.     \fID\fR\d\fIL\fR\u    is the round\(hytrip listener echo path delay in
  2048. milliseconds.
  2049. .PP
  2050. Transmission rating, \fIR\fR\d\fIL\fR\\d\fIE\fR\u, as a function of the
  2051. weighted echo path loss and listener echo\(hypath delay is shown in
  2052. Figure\ 1\(hy5.
  2053. .bp
  2054. .LP
  2055. .rs
  2056. .sp 37P
  2057. .ad r
  2058. \fBFigure\ 1\(hy5, p.\fR 
  2059. .sp 1P
  2060. .RT
  2061. .ad b
  2062. .RT
  2063. .PP
  2064. The transmission rating for listener echo, \fIR\fR\d\fIL\fR\\d\fIE\fR\u, 
  2065. can be combined with the transmission rating for overall loudness rating 
  2066. and 
  2067. circuit noise to give an overall transmission rating as follows:
  2068. \v'6p'
  2069. .ce 1000
  2070. \fIR
  2071. \dLNLE
  2072. \u\fR = 
  2073. [Unable to Convert Formula]
  2074. [Unable to Convert Formula]
  2075. .ce 0
  2076. .ad r
  2077. (1\(hy22)
  2078. \v'7p'
  2079. .ad b
  2080. .RT
  2081. .PP
  2082. .sp 1
  2083. Figure 1\(hy6 provides curves generated by means of the above
  2084. relationship for transmission rating as a function of weighted listener echo
  2085. path loss and listener echo path delay in a connection with an overall 
  2086. loudness rating of 16\ dB and a circuit noise of \(em56\ dBmp referred 
  2087. to a RLR of 
  2088. 0\ dB.
  2089. .bp
  2090. .LP
  2091. .rs
  2092. .sp 27P
  2093. .ad r
  2094. \fBFigure\ 1\(hy6, p. 
  2095. .sp 1P
  2096. .RT
  2097. .ad b
  2098. .RT
  2099. .PP
  2100. \fINote\fR \ \(em\ The preceding material is based on the use of a specific 
  2101. set of test results and the listener echo model of Reference\ [4]. Subsequently, 
  2102. new test results were reported in References\ [5] and\ [6] which also described 
  2103. studies of the two sets of tests results to see if a single model could 
  2104. be 
  2105. recommended. In general, the agreement between the two sets of results was
  2106. good. However, the newer results had lower opinion ratings at delays less 
  2107. than about 3\ ms. A conservative approach was to revise the original model 
  2108. to 
  2109. provide lower ratings at low delays while retaining the more critical
  2110. predictions at higher values of delay. The following equation (1\(hy20a) 
  2111. provides a satisfactory replacement for equation (1\(hy20) which accomplishes 
  2112. this 
  2113. goal.
  2114. \v'6p'
  2115. .ce 1000
  2116. \fIR
  2117. \dLE
  2118. \u\fR = 10.5 (\fIWEPL\fR + 7) (\fID
  2119. \dL\u\fR + 1)
  2120. \u\(em0.25
  2121. \d
  2122. .ce 0
  2123. .ad r
  2124. (1\(hy20a)
  2125. .ad b
  2126. .RT
  2127. .LP
  2128. .sp 1
  2129. .PP
  2130. Reference [6] also proposed that Weighted Echo Path Loss (WEPL) in the 
  2131. original model be replaced by Scaled Weighted Echo Path Loss (SWEPL). The 
  2132. proposal defined 
  2133. \v'6p'
  2134. .sp 1P
  2135. .ce 1000
  2136. \fIWEPL\fR = \fISM\fR + \fISF\fR 
  2137. .ce 0
  2138. .sp 1P
  2139. .LP
  2140. .sp 1
  2141. where
  2142. .LP
  2143.     \fISM\fR     is the singing margin,
  2144. .LP
  2145.     \fISF\fR     is the shape factor
  2146. .LP
  2147. and then defined
  2148. \v'6p'
  2149. .sp 1P
  2150. .ce 1000
  2151. \fISWEPL\fR = \fISM\fR + \fISF\fR 
  2152. @ { fISM\fR } over { ~+~\fISM\fR } @ 
  2153. .ce 0
  2154. .sp 1P
  2155. .LP
  2156. .sp 1
  2157. .bp
  2158. .LP
  2159. Hence, like \fIWEPL\fR ,
  2160. .LP
  2161.     \fISWEPL\fR \ =\ \fISM\fR , if \fISF\fR = 0.
  2162. .LP
  2163. Also,
  2164. .LP
  2165.     \fISWEPL\fR \ \( =\ \fIWEPL\fR , for \fISM\fR >> 1.
  2166. .PP
  2167. The effect of the shape factor is reduced as \fISM\fR  | pproaches
  2168. zero. Thus, the shape effect is cut in half when \fISM\fR is equal to unity, 
  2169. and 
  2170. approaches zero as \fISM\fR approaches zero. This avoids the possibility of a
  2171. positive \fISWEPL\fR when singing margin has become negative. Although 
  2172. the use of \fISWEPL\fR instead of \fIWEPL\fR will cause little change in 
  2173. most practical situations with typical values of \fISM\fR , the concept 
  2174. is attractive in forcing the singing margin to be specifically taken into 
  2175. account and is easily accomplished by 
  2176. replacing \fIWEPL\fR by \fISWEPL\fR in equation (1\(hy20a).
  2177. .sp 1P
  2178. .LP
  2179. 1.2.6
  2180.     \fITalker echo\fR 
  2181. .sp 9p
  2182. .RT
  2183. .PP
  2184. The transmission rating model for talker echo is
  2185. \v'6p'
  2186. .RT
  2187. .ce 1000
  2188. \fIR
  2189. \dE\u\fR = 92.73 \(em 53.45 log
  2190. \d10
  2191. \u 
  2192. @ left [ $$1o1~+~\fID\fR~$$2u sqrt { 1~+~ left ( { fID\fR } over { 80 } right ) $$2x2 } $$2e right ] @ 
  2193. + 2.277 \fIE\fR 
  2194. .ce 0
  2195. .ad r
  2196. (1\(hy23)
  2197. \v'2P'
  2198. .ad b
  2199. .RT
  2200. .LP
  2201. .sp 1
  2202. .LP
  2203. where
  2204. .LP
  2205.     \fIE\fR     is the OLR (in dB) of the talker echo path
  2206. .LP
  2207.     \fID\fR     is the round\(hytrip talker echo path delay in
  2208. milliseconds.
  2209. .PP
  2210. Transmission rating as a function of talker echo path loss and
  2211. delay is shown in Figure\ 1\(hy7 and has been derived to exclude the effects of
  2212. circuit noise and OLR. Transformation of the talker echo test results, which
  2213. included selected values of OLR and circuit noise, to the transmission 
  2214. rating scale, was accomplished using the \fIR\fR\d\fIL\fR\\d\fIN\fR\umodel. 
  2215. .PP
  2216. The transmission rating model for the combined effects of OLR,
  2217. circuit noise, echo path loss and echo path delay is
  2218. \v'6p'
  2219. .ce 1000
  2220. \fIR
  2221. \dLNE
  2222. \u\fR = 
  2223. [Unable to Convert Formula]
  2224. [Unable to Convert Formula]
  2225. .ce 0
  2226. .ad r
  2227. (1\(hy24)
  2228. \v'7p'
  2229. .ad b
  2230. .RT
  2231. .PP
  2232. .sp 1
  2233. Figure 1\(hy8 shows curves generated by means of the above
  2234. relationship for the transmission rating as a function of talker echo path 
  2235. loss and delay in a connection with an OLR of 16\ dB and circuit noise 
  2236. of \(em56\ dBmp. 
  2237. .sp 1P
  2238. .LP
  2239. 1.2.7
  2240.     \fISidetone\fR 
  2241. .sp 9p
  2242. .RT
  2243. .PP
  2244. The transmission rating model for OLR, total effective noise and
  2245. talker echo can be modified to include the effects of sidetone. The
  2246. transmission rating, \fIR\fR\d\fIL\fR\\d\fIN\fR\\d\fIS\fR\\d\fIT\fR\u, 
  2247. for OLR, total 
  2248. effective noise and sidetone is
  2249. \v'6p'
  2250. .EF '%    \fI\(''
  2251. .OF '''\fI\(    %'
  2252. .RT
  2253. .ce 1000
  2254. \fIR\fR\d\fIL\fR\\d\fIN\fR\\d\fIS\fR\\d\fIT\fR\u= \fIK\fR\d\fIS\fR\\d\fIT\fR\u\fIR\fR\d\fIL\fR\\d\fIN\fR\u 
  2255. .EF '%    \fI\(''
  2256. .OF '''\fI\(    %'
  2257. .ce 0
  2258. .ad r
  2259. (1\(hy25)
  2260. .ad b
  2261. .RT
  2262. .LP
  2263. .sp 1
  2264. and for talker echo and sidetone is
  2265. \v'6p'
  2266. .ce 1000
  2267. \fIR\fR\d\fIE\fR\\d\fIS\fR\\d\fIT\fR\u= \fIR\fR\d\fIE\fR\u+ 2.6(12 \(em 
  2268. \fISL\fR ) \(em\fR 1.5(4.5 \(em \fISR\fR )\u2\d + 3.38. 
  2269. .EF '%    \fI\(''
  2270. .OF '''\fI\(    %'
  2271. .ce 0
  2272. .ad r
  2273. (1\(hy26)
  2274. .ad b
  2275. .RT
  2276. .LP
  2277. .sp 1
  2278. .LP
  2279. The sidetone factor, \fIK\fR\d\fIS\fR\\d\fIT\fR\u, is calculated from
  2280. \v'6p'
  2281. .ce 1000
  2282. \fIK\fR\d\fIS\fR\\d\fIT\fR\u= 1.021 \(em 0.002(\fISL\fR \(em 15)\u2\d +
  2283. 0.001(\fISR\fR \(em 2)\u2\d
  2284. (\fISL\fR \(em 15).
  2285. .ce 0
  2286. .ad r
  2287. (1\(hy27)
  2288. .ad b
  2289. .RT
  2290. .LP
  2291. .sp 1
  2292. .bp
  2293. .LP
  2294. .rs
  2295. .sp 24P
  2296. .ad r
  2297. \fBFigura 1\(hy7, p.\fR 
  2298. .sp 1P
  2299. .RT
  2300. .ad b
  2301. .RT
  2302. .LP
  2303. .rs
  2304. .sp 24P
  2305. .ad r
  2306. \fBFigura 1\(hy8, p.\fR 
  2307. .sp 1P
  2308. .RT
  2309. .ad b
  2310. .RT
  2311. .LP
  2312. .bp
  2313. .PP
  2314. \fISL\fR  | s the sidetone masking rating (in dB), \fISR\fR  | s the
  2315. sidetone response (in dB/octave) below 1\ kHz. (The sidetone response above
  2316. 1\ kHz is 1.5\ times greater.
  2317. .FS
  2318.     \fISidetone Response:\fR     \fIBelow 1 kHz\fR     \fIAbove 1 kHz\fR     \ 0
  2319.     \ 0
  2320. .PP
  2321.     +3.0
  2322.     +4.5
  2323. .PP
  2324.     +6.0
  2325.     +9.0
  2326. .FE
  2327. )
  2328. .PP
  2329. Figure 1\(hy9 shows curves obtained by determining
  2330. \fIR\fR\d\fIL\fR\\d\fIN\fR\\d\fIS\fR\\d\fIT\fR\u | and \fIR\fR\d\fIE\fR\\d\fIS\fR\\d\fIT\fR\u, 
  2331. then substituting 
  2332. these values for \fIR\fR\d\fIL\fR\\d\fIN\fR\uand \fIR\fR\d\fIE\fR\urespectively 
  2333. in 
  2334. equation\ (1\(hy24).
  2335. .EF '%    \fI\(''
  2336. .OF '''\fI\(    %'
  2337. .EF '%    \fI\(''
  2338. .OF '''\fI\(    %'
  2339. .RT
  2340. .sp 1P
  2341. .LP
  2342. 1.3
  2343.     \fISubjective opinion models\fR 
  2344. .sp 9p
  2345. .RT
  2346. .PP
  2347. Subjective opinion in terms of the proportion of ratings in each
  2348. of the five categories (E, G, F, P,\ U) for a condition having a given
  2349. transmission rating has been found to depend on various factors such as the
  2350. subject group, the range of conditions presented in a test, the year in 
  2351. which the test was conducted, and whether the test was conducted on conversations 
  2352. in a laboratory environment or on normal telephone calls. The proportion 
  2353. of 
  2354. comments Good plus Excellent (G\ +\ E) or Poor plus Unsatisfactory (P\ 
  2355. +\ U) can be computed from the following equations: 
  2356. \v'6p'
  2357. .RT
  2358. .ce 1000
  2359. G + E = 
  2360. [Unable to Convert Formula]
  2361. [Unable to Convert Formula]
  2362. \fIe\fR \u\(em
  2363. [Unable to Convert Formula]
  2364. \d d
  2365. \fIt\fR 
  2366. .ce 0
  2367. .ad r
  2368. (1\(hy28)
  2369. \v'1P'
  2370. \v'2p'
  2371. .ad b
  2372. .RT
  2373. .ce 1000
  2374. .sp 1
  2375. P + U = 
  2376. [Unable to Convert Formula]
  2377. @ pile { (em\(if above int above B } @ 
  2378. \fIe\fR \u\(em
  2379. [Unable to Convert Formula]
  2380. \d d
  2381. \fIt\fR 
  2382. .ce 0
  2383. .ad r
  2384. (1\(hy29)
  2385. \v'1P'
  2386. \v'2p'
  2387. .ad b
  2388. .RT
  2389. .LP
  2390. .sp 1
  2391. where A and B are given below for data bases of primary interest.
  2392. .PP
  2393. For each data base listed below, the relationship between the
  2394. subjective judgements and transmission rating is shown in Figure\ 1\(hy10.
  2395. .LP
  2396. \fIData Base\fR 
  2397. .FS
  2398. The three data bases reflect different relationships
  2399. between the transmission rating scale and opinion ratings as determined in
  2400. different tests as indicated below:
  2401. \fI1965 Murray Hill SIBYL Test\fR \ \(em\ Opinions on actual intra\(hybuilding
  2402. business calls.
  2403. \fICCITT Conversation Tests\fR \ \(em\ Composite model of opinion in laboratory
  2404. conversation tests reported to the CCITT
  2405. in the 1973\(hy1976 Study Period (see\ [3]).
  2406. \fILong Toll Interviews\fR \ \(em\ Opinions expressed by North American 
  2407. Telephone 
  2408. customers when interviewed following a call on a long toll
  2409. connection.
  2410. .FE
  2411. .LP
  2412.     \ \ \ \ \fIA\fR     \ \ \ \ \fIB\fR 
  2413. .LP
  2414. 1965 Murray Hill SIBYL Test
  2415.     (R\(hy64.07)/17.57
  2416.     (R\(hy51.87)/17.57
  2417. .LP
  2418.     CCITT Conversation Tests
  2419.     (R\(hy62)/15
  2420.     (R\(hy43)/15
  2421. .LP
  2422.     Long Toll Interviews
  2423.     (R\(hy51.5)/15.71
  2424.     (R\(hy40.98)/15.71
  2425. .LP
  2426. .sp 2P
  2427. .LP
  2428. \fB2\fR \fBPrediction of transmission qualities from objective measurements\fR 
  2429. \fI(Geneva,\ 1980; modified in Malaga\(hy\fR 
  2430. \fITorremolinos,\ 1984) (Quoted in\fR 
  2431. \fIRecommendation\ P.11)\fR (Contribution from British Telecom)
  2432. .FS
  2433. Formerly,
  2434. Supplement\ No.\ 4, \fIRed Book\fR .
  2435. .FE
  2436. .sp 1P
  2437. .RT
  2438. .sp 1P
  2439. .LP
  2440.     \fISummary\fR 
  2441. .sp 9p
  2442. .RT
  2443. .PP
  2444. British Telecom makes extensive use of a theoretical model for
  2445. predicting the 
  2446. transmission performance of telephone connections
  2447. . A
  2448. brief description is here given of the structure of this model, and of the
  2449. computer program CATNAP, which embodies a simplified form of the model for
  2450. routine use, together with facilities for specifying connections in a
  2451. convenient practical way.
  2452. .bp
  2453. .RT
  2454. .LP
  2455. .rs
  2456. .sp 47P
  2457. .ad r
  2458. \fBFigure 1\(hy9, p. 16\fR 
  2459. .sp 1P
  2460. .RT
  2461. .ad b
  2462. .RT
  2463. .LP
  2464. .bp
  2465. .LP
  2466. .rs
  2467. .sp 27P
  2468. .ad r
  2469. \fBFigure\ 1\(hy10, p.17\fR 
  2470. .sp 1P
  2471. .RT
  2472. .ad b
  2473. .RT
  2474. .sp 1P
  2475. .LP
  2476. 2.1
  2477.     \fITypes of model\fR 
  2478. .sp 9p
  2479. .RT
  2480. .PP
  2481. Question 7/XII [14] recognises two types of \*Qmodel\*U for predicting 
  2482. the performance of complete telephone connections in conversation. The 
  2483. first 
  2484. kind, exemplified in Section\ 1 of this supplement, involves purely empirical
  2485. treatment of basic observations, and might lead to a set of tables, graphs 
  2486. or relatively simple formulae, representing performance as a function of 
  2487. certain objective quantities. In a model of this type, where attention 
  2488. is focussed 
  2489. entirely on the correspondence between input (objective quantities)
  2490. and output (subjective performance), the \fIform\fR of the functions employed 
  2491. has no significance in itself. For convenience, simplicity is usually sought, 
  2492. but is obtained at the expense of generality. Interactions between different 
  2493. degradations are often difficult enough to treat in any case; but, besides, 
  2494. a purely empirical model must usually be completely revised when a new 
  2495. degradation is brought in. For example, suppose relationships have been
  2496. established between loss, noise and 
  2497. opinion score
  2498. for one particular
  2499. bandwidth: changing that bandwidth to a new constant value will necessitate 
  2500. a redetermination of the functions \(em not just a constant adjustment 
  2501. of the 
  2502. output. In short, it is unreasonable to expect that a purely empirical model
  2503. could have more than limited success in predicting performance.
  2504. .PP
  2505. Models of the second type (mentioned in [15]) are intended to overcome 
  2506. these disadvantages by making the structure of the evaluation process reflect 
  2507. the cause\(hyand\(hyeffect relationships which lead from the input (properties 
  2508. of the connection; acoustic environment; characteristics of the participants' 
  2509. hearing, speech sounds and language systems, etc.) to the output (participants' 
  2510. satisfaction or estimate of performance). Such a model is inherently more
  2511. complicated, and requires more work to develop initially, but can then be
  2512. extended and applied with much greater ease and confidence. Numerical
  2513. parameters may and do require revision as more reliable data become available, 
  2514. but the structure, if well chosen, will only rarely require major alterations. 
  2515. As a research tool, such a model is much more powerful in its capability 
  2516. of 
  2517. generating hypotheses to be tested than a collection of useful but arbitrary
  2518. formulae. As a planning or application tool, it lends itself easily to being
  2519. embodied in a computer program, to which readily available data (such as 
  2520. losses and line lengths) can be supplied as input. 
  2521. .bp
  2522. .RT
  2523. .LP
  2524. .sp 1P
  2525. .LP
  2526. 2.2
  2527.     \fIModel and programs: SUBMOD, CATPASS and CATNAP\fR 
  2528. .sp 9p
  2529. .RT
  2530. .PP
  2531. The model here described is of the more fundamental type. It
  2532. is intended to predict loudness judgements, listening\(hyeffort scores,
  2533. conversation\(hyopinion scores and vocal levels from objective information
  2534. supplied. It is embodied in a program called SUBMOD (mnemonic for SUBJECTIVE
  2535. MODEL) which accepts the overall frequency responses of the speech\(hytransmission 
  2536. paths as input, and makes provision for changing the parameters of the 
  2537. model in order to improve agreement between theory and observation. Reference\ 
  2538. [16] 
  2539. describes an earlier version of the same model.
  2540. .PP
  2541. In its present state of development the model deals fairly
  2542. successfully with the subjective effects of circuit loss,
  2543. attenuation\(hyfrequency distortion, circuit noise, quantizing noise, room 
  2544. noise, and sidetone paths, for a reasonably wide range of values of these 
  2545. characteristics in any combination. Effects of some other phenomena can 
  2546. also be approximately estimated, but are not yet incorporated in the model. 
  2547. No attempt has yet been made to cater for features such as voice\(hyswitching 
  2548. effects, or 
  2549. vocoding and other sophisticated schemes for reducing information rate. 
  2550. Compare the groups of factors listed in Question\ 7/XII\ [14]. 
  2551. .PP
  2552. The program CATPASS [16] \(em a mnemonic for COMPUTER\(hyAIDED TELEPHONY
  2553. PERFORMANCE ASSESSMENT \(em incorporated the same model in a simplified,
  2554. fixed\(hyparameter implementation, together with facilities for calculating the
  2555. sensitivity\(hyfrequency response of a complete connection formed by concatenating 
  2556. common pieces of apparatus such as telephones, cables, feeding bridges, 
  2557. junctions, and filters. It was similar to the system described in\ [17]
  2558. and\ [18], but the program was differently organized. However, CATPASS could
  2559. handle symmetrical connections only \(em that is, those for which transmission,
  2560. room noise, sidetone and all other relevant features were the same for both
  2561. participants. It was superseded by a program called CATNAP (COMPUTER\(hyAIDED
  2562. TELEPHONE NETWORK ASSESSMENT PROGRAM), which incorporated an extended form 
  2563. of the fixed\(hyparameter model, allowing asymmetry in the connections, 
  2564. as well as 
  2565. containing facilities for assembling performance statistics on sets of
  2566. connections. See\ [19].
  2567. .PP
  2568. CATNAP has been superseded in turn by CATNAP83, in which three main
  2569. changes have been made:
  2570. .RT
  2571. .LP
  2572.     a)
  2573.     minor improvements to the subjective model;
  2574. .LP
  2575.     b)
  2576.     calculation of loudness ratings according to
  2577. Recommendation\ P.79, instead of the provisional version P.XXE\ [20] which
  2578. (notwithstanding the statement made in the earlier version of this
  2579. Supplement\ [21]) was used for calculating loudness ratings in CATNAP;
  2580. .LP
  2581.     c)
  2582.      introduction of more flexibility to allow parameters such as the earphone 
  2583. coupling loss factor (\fIL\fR\d\fIE\fR\u) to depend on the particular type 
  2584. of handset. 
  2585. .sp 1P
  2586. .LP
  2587. 2.3
  2588.     \fISituation to be represented\fR 
  2589. .sp 9p
  2590. .RT
  2591. .PP
  2592. Let A and B denote two \*Qaverage\*U participants in a telephone
  2593. conversation over a link terminated in handset telephones, located in rooms
  2594. with no abnormal reverberation and with specified levels of room noise.
  2595. \*QAverage\*U is intended to convey that the participants have representative
  2596. hearing and speaking characteristics and a normal attitude towards telephone
  2597. facilities, so that their satisfaction with the telecommunication link 
  2598. may be measured by the 
  2599. mean Conversation Opinion Score
  2600. (\fIY\fR\d\fIC\fR\u) and the 
  2601. Percentage Difficulty
  2602. (%\fID\fR ) that would be obtained from a
  2603. conversation test, as described in Supplement\ No.\ 2. \fIY\fR\d\fIC\fR\ucan 
  2604. take any value between\ 4 and\ 0, the scale being: 4\ =\ EXCELLENT, 3\ 
  2605. =\ GOOD, 2\ =\ FAIR, 1\ =\ POOR, 0\ =\ BAD. %\fID\fR can of course take 
  2606. any value between 0 for the best connections and 100% for the worst. 
  2607. .PP
  2608. For a given connection, the quantities of chief interest are
  2609. \fIY\fR\d\fIC\fR\u, %\fID\fR  | and the speech level, for each participant. 
  2610. However, other useful auxiliary quantities are computed in the course of 
  2611. the evaluation, such as the loudness ratings of the various paths (calculated 
  2612. according to 
  2613. Recommendation\ P.79), and \fIY\fR\d\fIL\fR\\d\fIE\fR\u, the mean 
  2614. Listening Effort
  2615. Score
  2616. that would result from a listening opinion test conducted as outlined in\ 
  2617. Supplement\ No.\ 2. In a listening test of this type, lists of sentences 
  2618. at a standard input speech level are transmitted over the connection and 
  2619. the 
  2620. listener expresses an opinion, at a number of different listening levels, on
  2621. the \*Qlistening effort\*U according to the following scale:
  2622. .RT
  2623. .LP
  2624. \fIEffort required to understand the meanings of sentences\fR 
  2625. .LP
  2626. A
  2627.     Complete relaxation possible; no effort required
  2628. .LP
  2629. B
  2630.     Attention necessary; no appreciable effort required
  2631. .LP
  2632. C
  2633.     Moderate effort required
  2634. .LP
  2635. D
  2636.     Considerable effort required
  2637. .LP
  2638. E
  2639.     No meaning understood with any feasible effort.
  2640. .bp
  2641. .PP
  2642. The votes are scored A\ =\ 4, B\ =\ 3, C\ =\ 2, D\ =\ 1, E\ =\ 0, and
  2643. the mean taken over all listeners is called the Listening Effort Score,
  2644. \fIY\fR\d\fIL\fR\\d\fIE\fR\u, for each particular listening level and each 
  2645. circuit 
  2646. condition.
  2647. .PP
  2648. More detailed information about both conversation tests and listening tests 
  2649. may be found in\ [22], and also in Supplement\ No.\ 2. 
  2650. .RT
  2651. .sp 1P
  2652. .LP
  2653. 2.4
  2654.     \fIOutline of the model\fR 
  2655. .sp 9p
  2656. .RT
  2657. .PP
  2658. The model requires the following inputs:
  2659. .RT
  2660. .LP
  2661.     1)
  2662.     overall sensitivity\(hyfrequency characteristic of each
  2663. transmission path (talker's mouth to listener's ear via the
  2664. connection) and sidetone path (each talker's mouth to his own
  2665. ear). These sensitivities may be either measured by the method
  2666. described in Recommendation\ P.64 or calculated as explained in
  2667. Reference\ [17];
  2668. .LP
  2669.     2)
  2670.     noise spectrum and level at each listener's ear, composed
  2671. of noise arising in the circuit, room noise reaching the
  2672. listening ear direct, and room noise reaching the listening
  2673. ear via the sidetone path. In the absence of specific
  2674. measurements, standard noise spectra and levels are taken;
  2675. e.g.\ room noise with Hoth spectrum at 50\ dBA, circuit noise
  2676. with bandlimited spectrum at a specified psophometrically
  2677. weighted level;
  2678. .LP
  2679.     3)
  2680.     average speech spectrum and average threshold of hearing,
  2681. as given for example in\ [23].
  2682. .PP
  2683. From these data the 
  2684. loudness ratings
  2685. are calculated. With speech level fixed, \fIY\fR\d\fIL\fR\\d\fIE\fR\u | 
  2686. and a provisional value of \fIY\fR\d\fIC\fR\uare 
  2687. evaluated for each participant. The relationships between \fIY\fR\d\fIC\fR\uand 
  2688. speech 
  2689. level at each end are then used to refine the values of both, so that the 
  2690. final estimates represent performance at realistic conversational speech 
  2691. levels. 
  2692. .sp 1P
  2693. .LP
  2694. 2.5
  2695.     \fICalculation of\fR 
  2696. \fIloudness\fR \fIand\fR 
  2697. \fIloudness\fR 
  2698. \fIratings\fR 
  2699. .sp 9p
  2700. .RT
  2701. .PP
  2702. The model starts by setting the speech level emitted from each
  2703. talker to a standard value and calculating the resultant spectrum and level 
  2704. of both speech and noise at each listener's ear. The loudness of received 
  2705. speech is calculated as a function of signal level, noise level and threshold 
  2706. of 
  2707. hearing, integrated over the frequency range extending normally from 179\ to
  2708. 4472\ Hz (14\ bands, the lowest centred at 200\ Hz and the highest at 4000\ 
  2709. Hz). 
  2710. The loudness of the sidetone speech is calculated similarly, but with an
  2711. allowance for the additional masking effect of speech reaching the ear
  2712. naturally (via the air path and the bone\(hyconduction path). By comparison 
  2713. with the loudness of speech transmitted over an IRS ( 
  2714. Intermediate Reference
  2715. System
  2716. ), the loudness ratings of the various paths are evaluated:
  2717. SLR
  2718. RLR
  2719. and 
  2720. STMR
  2721. for each end, and 
  2722. OLR
  2723. in each direction.
  2724. .PP
  2725. The method is described in [24], but is not given in detail here. The loudness 
  2726. part of the model is important in its own right [for example in the 
  2727. study of Question\ 19/XII\ [25]], but not closely connected with the rest 
  2728. of the model. The program outputs loudness ratings calculated according 
  2729. to 
  2730. Recommendation\ P.79, but also calculates a set of loudness ratings according 
  2731. to the earlier method\ [26] which are used for subsequent calculations. 
  2732. .RT
  2733. .sp 1P
  2734. .LP
  2735. 2.6
  2736.     \fICalculation of\fR 
  2737. \fIlistening effort score\fR 
  2738. .sp 9p
  2739. .RT
  2740. .PP
  2741. This part of the model is intended to reproduce the result that
  2742. would be obtained from a Listening Opinion Test.
  2743. .PP
  2744. It has been found possible to estimate \fIY\fR\d\fIL\fR\\d\fIE\fR\u | by 
  2745. a process 
  2746. similar to those already well known in calculating loudness and articulation
  2747. score. An intermediate quantity, Listening Opinion Index (LOI), is first
  2748. calculated as follows. Each elementary band in the frequency range contributes 
  2749. to LOI an amount proportional to the product 
  2750. \fIB\fR `
  2751. \fI\fI\d\fIf\fR\u\fIP\fR \ (\fIZ\fR\d\fIf\fR\u),
  2752. where \fIB\fR `
  2753. \fI\fI\d\fIf\fR\uis a frequency\(hyweighting factor expressing the
  2754. relative importance of that elementary
  2755. .bp
  2756. .PP
  2757. band for effortless
  2758. comprehension, and
  2759. \fIP\fR is a growth function applied to the sensation level\ \fIZ\fR (which 
  2760. has already been evaluated for the loudness calculation). The actual values 
  2761. of the 
  2762. frequency\(hyweightings differ somewhat from those used in loudness and
  2763. articulation calculations; the growth function is limited to the range\ 
  2764. 0 to\ 1 as in articulation, but the form used is: 
  2765. \v'6p'
  2766. .RT
  2767. .sp 1P
  2768. .ce 1000
  2769. \fIP\fR (\fIZ\fR ) = 10
  2770. \u
  2771. @ { fIZ\fR~+~3.8 } over { 0 } @ 
  2772. \d\ \ if \fIZ\fR < \(em11,
  2773. .ce 0
  2774. .sp 1P
  2775. .ce 1000
  2776. .sp 1
  2777. \fIP\fR (\fIZ\fR ) = 1 \(em 10
  2778. \u
  2779. @ { (em0.3 (\fIZ\fR~+~14) } over { 0 } @ 
  2780. \d\ \ otherwise.
  2781. .ce 0
  2782. .sp 1P
  2783. .PP
  2784. .sp 1
  2785. LOI is proportional to
  2786. \s16\(is
  2787. \s9\fIB\fR `
  2788. \fI\d\fIf\fR\u\fIP\fR (\fIZ\fR\d\fIf\fR\u)
  2789. d
  2790. \fIf\fR , but in practice the integral is replaced by a summation over 
  2791. a number of bands (normally 14), within each of which \fIZ\fR\d\fIf\fR\uand 
  2792. \fIB\fR `
  2793. \fI\fI\d\fIf\fR\uare reasonably constant, just as in the loudness
  2794. evaluation. The formula actually used is:
  2795. \v'6p'
  2796. .RT
  2797. .sp 1P
  2798. .ce 1000
  2799. LOI = \fIAD\fR @ pile { sum above \fIi\fR } @\fIB\fR `
  2800. \fI
  2801. \di\u\fR \fIP\fR (\fIZ
  2802. \di\u\fR )
  2803. .ce 0
  2804. .sp 1P
  2805. .LP
  2806. .sp 1
  2807. .LP
  2808. where
  2809. .LP
  2810.     \fIB\fR `
  2811. \fI\fI\d\fIi\fR\u    is the frequency weighting for the
  2812. \fIi\fR th\ band, (shown diagrammatically in Figure\ 2\(hy1),
  2813. .LP
  2814.     \fIZ\fR\d\fIi\fR\u    is the mean \fIZ\fR \ in the \fIi\fR \ th band,
  2815. .LP
  2816.     \fIP\fR     is the appropriate growth function (illustrated in
  2817. Figure\ 2\(hy2),
  2818. .LP
  2819.     \fIA\fR     is a multiplier depending on the received speech level,
  2820. with the value\ 1 for a small range of levels around the optimum
  2821. but decreasing rapidly outside this range (see Figure\ 2\(hy3 where the zero
  2822. abscissa now corresponds to OLR = 8\ dB (Recommendation\ P.XXE\ [20]) instead 
  2823. of 4\ dB as previously), 
  2824. .LP
  2825.     \fID\fR     is a multiplier depending on the received noise level
  2826. (ICN\(hyRLR) with a value decreasing slowly from\ 1 at negligible
  2827. noise levels towards\ 0 at very high levels (see Figure\ 2\(hy4).
  2828. .LP
  2829. .rs
  2830. .sp 22P
  2831. .ad r
  2832. \fBFigure\ 2\(hy1, p.\fR 
  2833. .sp 1P
  2834. .RT
  2835. .ad b
  2836. .RT
  2837. .LP
  2838. .bp
  2839. .LP
  2840. .rs
  2841. .sp 24P
  2842. .ad r
  2843. \fBFigure\ 2\(hy2, p.\fR 
  2844. .sp 1P
  2845. .RT
  2846. .ad b
  2847. .RT
  2848. .LP
  2849. .rs
  2850. .sp 24P
  2851. .ad r
  2852. \fBFigure\ 2\(hy3, p.\fR 
  2853. .sp 1P
  2854. .RT
  2855. .ad b
  2856. .RT
  2857. .LP
  2858. .bp
  2859. .LP
  2860. .rs
  2861. .sp 19P
  2862. .ad r
  2863. \fBFigure\ 2\(hy4, p.\fR 
  2864. .sp 1P
  2865. .RT
  2866. .ad b
  2867. .RT
  2868. .PP
  2869. Thus it is only for wide\(hyband, noise\(hyfree, distortion\(hyfree speech 
  2870. at optimum listening level that LOI attains its maximum value of 
  2871. unity.
  2872. .PP
  2873. The Listening Opinion Index is related to \fIY\fR\d\fIL\fR\\d\fIE\fR\u | 
  2874. in a manner 
  2875. which depends on the standard of transmission to which listeners have been
  2876. accustomed in their recent experience. It is found that the subjects' standard 
  2877. of judgement is influenced mostly by the best circuit condition experienced 
  2878. in the current experiment, or, in real calls, by the quality of the best 
  2879. connections normally experienced. For example, a circuit condition which 
  2880. earns a score of almost 4 in an experiment where it is the best condition, 
  2881. would earn a score of perhaps only 3 if a practically perfect condition 
  2882. were included in the same experiment, and about 3.5 if the best condition 
  2883. in the same experiment were equivalent in performance to the best connection 
  2884. that can normally occur in the British Telecom system. A parameter\ LOI 
  2885. \s6LIM
  2886. .PS 10
  2887. ,
  2888. introduced to cater for this effect, specifies the value of LOI that
  2889. corresponds to maximum \fIY\fR\d\fIL\fR\\d\fIE\fR\u; it is generally set 
  2890. equal to 0.885 
  2891. when connections are being judged against a background of experience with 
  2892. the British Telecom network. The relationship in general terms is 
  2893. \v'6p'
  2894. .RT
  2895. .sp 1P
  2896. .ce 1000
  2897. ln
  2898. @ left ( { fIY~\dLE~\u\fR } over { ~\(em~\fIY~\dLE~\u\fR } right ) @ 
  2899. = 1.465 
  2900. @ left [ ln left ( { OI } over { OI~\dLIM~\u~\(em~LOI } right ) \(em~0.75~ right ] @ 
  2901. .ce 0
  2902. .sp 1P
  2903. .LP
  2904. .sp 1
  2905. as shown in Figure\ 2\(hy5. This brings us to the point where \fIY\fR\d\fIL\fR\\d\fIE\fR\u | 
  2906. has been evaluated for each participant as a function of listening level\ 
  2907. \(em in 
  2908. particular, at the listening level established for each participant when the
  2909. other speaks at Reference Vocal Level (RVL), defined in\ [27].
  2910. .sp 1P
  2911. .LP
  2912. 2.7
  2913.     \fICalculation of\fR 
  2914. \fIConversation Opinion Score\fR 
  2915. .sp 9p
  2916. .RT
  2917. .PP
  2918. In order to convert a value of \fIY\fR\d\fIL\fR\\d\fIE\fR\u | at the appropriate 
  2919. listening level to the corresponding value of Conversation Opinion Score
  2920. (\fIY\fR\d\fIC\fR\u), it is necessary to take account of deviations of 
  2921. mean vocal 
  2922. level from RVL.
  2923. .PP
  2924. The symbol \fIV\fR\d\fIL\fR\u | is used to denote the electrical speech 
  2925. level in dBV at the output of a sending end when the acoustic level at 
  2926. the input (mouth reference point) is RVL. During conversation, a different 
  2927. level (\fIV\fR\d\fIC\fR\u) will generally prevail at the same point, because 
  2928. participants tend to raise 
  2929. their voices if incoming speech is faint or poor in quality and to lower 
  2930. them if incoming speech is loud. In other words, \fIV\fR\d\fIC\fR\uat end\ 
  2931. \fIA\fR depends on 
  2932. \fIY\fR\d\fIL\fR\\d\fIE\fR\uat end\ \fIA\fR , which depends on \fIV\fR\d\fIC\fR\uat 
  2933. end B, which depends on 
  2934. \fIY\fR\d\fIL\fR\\d\fIE\fR\uat end \fIB\fR , which depends in turn on \fIV\fR\d\fIC\fR\uat 
  2935. end \fIA\fR . Thus there is a circular dependence or feedback effect. 
  2936. .bp
  2937. .RT
  2938. .LP
  2939. .rs
  2940. .sp 21P
  2941. .ad r
  2942. \fBFigure\ 2\(hy5, p.\fR 
  2943. .ad b
  2944. .RT
  2945. .PP
  2946. The sidetone paths introduce complications when STMR < | 3\ dB
  2947. (besides contributing noise from the environment to the receiving channel as
  2948. already explained). Other things being equal, each talker's vocal level goes
  2949. down by almost 1\ dB for every 3\ dB decrease in STMR below 13\ dB, and this of
  2950. course further modifies the opinion scores and speech levels at both ends by
  2951. virtue of the feedback effect.
  2952. .PP
  2953. In addition to this, very high sidetone levels are experienced as
  2954. unpleasant \fIper\ se\fR , particularly when the connection is poor for other
  2955. reasons.
  2956. .PP
  2957. This complex interrelationship is found to be reasonably well
  2958. represented by the following equations.
  2959. .RT
  2960. .LP
  2961.     \fIY\fR `
  2962. \fI
  2963. \dC\u\fR \ is an intermediate quantity explained
  2964. below.
  2965. \v'6p'
  2966. .ce 1000
  2967. ln
  2968. @ left ( { fIY\fR~`~\fI~\dC\u\fR } over { ~\(em~\fIY\fR~`~\fI~\dC\u\fR } right ) @ 
  2969. = 0.7
  2970. @ left [ ln left ( { fIY~\dLE~\u\fR } over { ~\(em~\fIY~\dLE~\u\fR } right ) ~+~0.5~\(em~ {  (13~\(em~STMR) } over { 0 } left ( { ~\(em~\fIY~\dLE~\u\fR } over { fIY~\dLE~\u\fR } right ) $$2x2 right ] @ 
  2971. .ce 0
  2972. .ad r
  2973. (2\(hy1)
  2974. \v'7p'
  2975. .ad b
  2976. .RT
  2977. .ce 1000
  2978. .sp 1
  2979. \fIV
  2980. \dC\u\fR \(em \fIV
  2981. \dL\u\fR = 4.0 \(em 2.1 \fIY\fR `
  2982. \fI
  2983. \dC\u\fR \(em 0.3 K (13 \(em STMR)
  2984. .ce 0
  2985. .ad r
  2986. (2\(hy2)
  2987. .ad b
  2988. .RT
  2989. .LP
  2990. .sp 1
  2991. .ce 1000
  2992. ln
  2993. @ left ( { fIY~\dC\u\fR } over { ~\(em~\fIY~\dC\u\fR } right ) @ 
  2994. = 0.8451
  2995. ln
  2996. @ left ( { fIY\fR~`~\fI~\dC\u\fR } over { ~\(em~\fIY\fR~`~\fI~\dC\u\fR } right ) @ 
  2997. \(em 0.2727
  2998. .ce 0
  2999. .ad r
  3000. (2\(hy3)
  3001. \v'7p'
  3002. .ad b
  3003. .RT
  3004. .LP
  3005. .sp 1
  3006. where
  3007. .LP
  3008.     K\ =\ 1 if STMR <\ 13,
  3009. .LP
  3010.     K\ =\ 0 otherwise.
  3011. .PP
  3012. By substituting in equation (2\(hy1) the value of \fIY\fR\d\fIL\fR\\d\fIE\fR\u | 
  3013. already found for end\ A \(em which would apply for \fIV\fR\d\fIC\fR\u\ 
  3014. =\ \fIV\fR\d\fIL\fR\uat end B\ \(em 
  3015. one obtains a first approximation to \fIY\fR `
  3016. \fI
  3017. \dC\u\fR , then from
  3018. equation\ (2\(hy2) an approximation to \fIV\fR\d\fIC\fR\uat end A. The 
  3019. earlier calculations are repeated with this speech level to find a new 
  3020. value of \fIY\fR\d\fIL\fR\\d\fIE\fR\uat 
  3021. end\ B, hence an approximation to \fIY\fR `
  3022. \fI
  3023. \dC\u\fR and \fIV\fR\d\fIC\fR\uat end\ B. This
  3024. process is repeated cyclically until each \fIY\fR `
  3025. \fI
  3026. \dC\u\fR converges to a
  3027. settled value, and then equations (2\(hy1) and (2\(hy2) are simultaneously
  3028. satisfied.
  3029. .PP
  3030. Figure 2\(hy6 shows the form of the resultant relationship between
  3031. \fIY\fR\d\fIL\fR\\d\fIE\fR\u | and \fIY\fR `
  3032. \fI
  3033. \dC\u\fR ,  for two different values of STMR,
  3034. with \fIV\fR\d\fIC\fR\uat its proper value. The transformation [equation 
  3035. (2\(hy3)], 
  3036. illustrated in Figure\ 2\(hy7, is then applied to the intermediate score
  3037. \fIY\fR `
  3038. \fI
  3039. \dC\u\fR , to give the estimated Conversation Opinion Score
  3040. \fIY\fR\d\fIc\fR\u, which is shown as a function of \fIY\fR\d\fIL\fR\\d\fIE\fR\uin 
  3041. Figure\ 2\(hy8.
  3042. .bp
  3043. .RT
  3044. .LP
  3045. .rs
  3046. .sp 24P
  3047. .ad r
  3048. \fBFigure 2\(hy6, p.\fR 
  3049. .sp 1P
  3050. .RT
  3051. .ad b
  3052. .RT
  3053. .LP
  3054. .rs
  3055. .sp 24P
  3056. .ad r
  3057. \fBFigures 2\(hy7 and 2\(hy8, p.\fR 
  3058. .sp 1P
  3059. .RT
  3060. .ad b
  3061. .RT
  3062. .LP
  3063. .bp
  3064. .sp 1P
  3065. .LP
  3066. 2.8
  3067.     \fIEvaluation of other subjective measures of performance\fR 
  3068. .sp 9p
  3069. .RT
  3070. .PP
  3071. Relationships have been developed for various dichotomies of the
  3072. opinion scale \(em such as proportion of votes greater than\ 2 (i.e.\ votes
  3073. \*QExcellent\*U or \*QGood\*U) \(em and for the percentage of positive 
  3074. replies to the 
  3075. \*QDifficulty\*U question (Supplement\ No.\ 2).
  3076. .PP
  3077. For example, percentage \*QDifficulty\*U is represented by the
  3078. equation
  3079. \v'6p'
  3080. .RT
  3081. .sp 1P
  3082. .ce 1000
  3083. ln 
  3084. @ left ( { fID\fR } over { ~\(em~\fID\fR } right ) @ 
  3085. = \(em2.3
  3086. ln
  3087. @ left ( { fIY~\dC\u\fR } over { ~\(em~\fIY~\dC\u\fR } right ) @ 
  3088. .ce 0
  3089. .sp 1P
  3090. .LP
  3091. .sp 1
  3092. where
  3093. .LP
  3094.     \fID\fR \ \(mu\ 100\ =\ %\fID\fR .
  3095. .PP
  3096. However, these relationships are satisfactory only for certain
  3097. kinds of degradation and are still under review.
  3098. .sp 1P
  3099. .LP
  3100. 2.9
  3101.     \fICorrespondence between calculated and observed values\fR 
  3102. .sp 9p
  3103. .RT
  3104. .PP
  3105. For symmetrical connections, provided very high sidetone levels and very 
  3106. high room noise levels are excluded, the model reproduces fairly well 
  3107. the results of laboratory conversation tests carried out in the U.K. In the
  3108. most recent laboratory tests there is a tendency for speech levels and hence
  3109. opinion scores to be somewhat lower than those observed earlier, but the
  3110. relativities between circuit conditions are not much disturbed by this. 
  3111. It is believed, but not yet fully established, that approximately the same 
  3112. relativities hold good for other populations of subjects \(em in particular, 
  3113. for the population of ordinary telephone users accustomed to the British 
  3114. Telecom 
  3115. system \(em even though different absolute values of scores may be obtained 
  3116. from other populations of subjects or by using different experimental 
  3117. procedures.
  3118. .PP
  3119. Comparatively few results are available from experiments on
  3120. asymmetrical connections, but such evidence as there is indicates that the
  3121. model predicts too much divergence between the two ends of the connection \(em
  3122. especially in respect of \fIV\fR\d\fIC\fR\u, less so in respect of \fIY\fR\d\fIC\fR\u. 
  3123. It is proposed to introduce a feedback feature to reduce the divergence 
  3124. between 
  3125. the two \fIV\fR\d\fIC\fR\uvalues, but care will be needed not to reduce 
  3126. the \fIY\fR\d\fIC\fR\u 
  3127. divergence too far as a result of this. HRC\ 4 in Annex\ A gives an example of
  3128. CATNAP calculations for a set of connections with asymmetrical losses: 
  3129. compare these predictions with Reference\ [30] there quoted. 
  3130. .PP
  3131. Predictions of \fIY\fR\d\fIC\fR\u | and \fIV\fR\d\fIC\fR\u | from both 
  3132. CATNAP83 have been 
  3133. compared with the results of a number of conversation experiments conducted 
  3134. in the U.K. since\ 1976. The degree of agreement is summed up in 
  3135. Table\ 2\(hy1.
  3136. .RT
  3137. .ce
  3138. \fBH.T. [T2.3]\fR 
  3139. .ce
  3140. TABLE\ 2\(hy1
  3141. .ce
  3142. \fBComparison of observed (O) and predicted (P) results for two
  3143. .ce
  3144. models\fR 
  3145. .ps 9
  3146. .vs 11
  3147. .nr VS 11
  3148. .nr PS 9
  3149. .TS
  3150. center box;
  3151. cw(36p) | cw(60p) | cw(36p) | cw(24p) sw(24p) sw(24p) sw(24p) , ^  | ^  | ^  | c s | c 
  3152. ^  | ^  | ^  | c | c | c | c.
  3153. Program    Types of connection    No. of conversations    Deviations (O\ \(em\ P)
  3154.             Mean    r.m.s.    \fIV\fI    \fIY\fI    \fIV\fI    \fIY\fI
  3155. _
  3156. .T&
  3157. cw(36p) | lw(60p) | cw(36p) | cw(24p) | cw(24p) | cw(24p) | cw(24p) .
  3158. CATNAP\ \     Symmetrical only    680    \(em0.8    \(em0.29    4.1    0.41
  3159. .T&
  3160. cw(36p) | lw(60p) | cw(36p) | cw(24p) | cw(24p) | cw(24p) | cw(24p) .
  3161. CATNAP\ \     Symmetrical and asymmetrical    883    \(em1.0    \(em0.22    3.8    0.38
  3162. .T&
  3163. cw(36p) | lw(60p) | cw(36p) | cw(24p) | cw(24p) | cw(24p) | cw(24p) .
  3164. CATNAP83    Symmetrical only    680    \(em0.2    \(em0.02    4.0    0.26
  3165. .T&
  3166. cw(36p) | lw(60p) | cw(36p) | cw(24p) | cw(24p) | cw(24p) | cw(24p) .
  3167. CATNAP83    Symmetrical and asymmetrical    883    \(em0.4    +0.14    3.8    0.44
  3168. _
  3169. .TE
  3170. .nr PS 9
  3171. .RT
  3172. .ad r
  3173. \fBTable 2\(hy1 [T2.3], p.\fR 
  3174. .sp 1P
  3175. .RT
  3176. .ad b
  3177. .RT
  3178. .LP
  3179. .bp
  3180. .PP
  3181. It will be seen that the improvement in \fIY\fR\d\fIC\fR\u | as predicted 
  3182. for symmetrical connections has been achieved at the cost of a slight increase 
  3183. in the r.m.s. deviation of \fIY\fR\d\fIC\fR\uwhen asymmetrical connections 
  3184. are included. But in view of the further alterations expected to be needed 
  3185. for the adequate 
  3186. prediction of the performance of asymmetrical connections, it is appropriate
  3187. at the present stage to be guided mainly by the results for symmetrical
  3188. connections.
  3189. .sp 2P
  3190. .LP
  3191. 2.10
  3192.     \fIIncorporating miscellaneous degradations\fR 
  3193. .sp 1P
  3194. .RT
  3195. .sp 1P
  3196. .LP
  3197. 2.10.1
  3198.     \fIPCM quantizing distortion\fR 
  3199. .sp 9p
  3200. .RT
  3201. .PP
  3202. Reference [28] describes a method for handling the effects of
  3203. quantizing distortion in PCM systems. It is there established that a
  3204. quantity\ \fIQ\fR , effective speech\(hyto\(hyquantization\(hynoise ratio 
  3205. in dB, can be 
  3206. evaluated for any specified type of PCM system as a function of input speech
  3207. level. It has been found that the subjective effect of a given value of 
  3208. \fIQ\fR can be approximated by that of a level of continuous circuit noise 
  3209. \fIG\fR \ dB below the speech level, where 
  3210. \v'6p'
  3211. .RT
  3212. .sp 1P
  3213. .ce 1000
  3214. \fIG\fR \ =\ 1.07\ +\ 0.285\ \fIQ\fR \ +\ 0.0602\ \fIQ\fR \u2\d.
  3215. .ce 0
  3216. .sp 1P
  3217. .PP
  3218. .sp 1
  3219. Thus for a connection involving PCM links, one must include an
  3220. evaluation of equivalent noise level in the iterative process that determines 
  3221. \fIV\fR\d\fIC\fR\u: each successive approximation to \fIV\fR\d\fIC\fR\uleads 
  3222. to a new value 
  3223. for \fIQ\fR , hence to a new value for \fIG\fR , and hence to a new contribution 
  3224. to the circuit noise to be taken into account in calculating the new value 
  3225. of 
  3226. \fIY\fR\d\fIL\fR\\d\fIE\fR\u. In practice these modifications have negligible 
  3227. effect 
  3228. unless the speech level at the input to the PCM system falls below about
  3229. \(em25\ dBV, or the circuit noise at the same point is very high, or the speech
  3230. input level is so high (say > | (em5\ dBV) that appreciable peak limiting
  3231. occurs.
  3232. .sp 1P
  3233. .LP
  3234. 2.10.2
  3235.     \fISyllabic companding\fR 
  3236. .sp 9p
  3237. .RT
  3238. .PP
  3239. The case of a 2:1 syllabic compandor can be simply handled by
  3240. finding a subjectively equivalent continuous noise level.
  3241. .PP
  3242. Let \fIS\fR  | be the speech level at the input to the compressor, and 
  3243. \fIN\fR  | be the noise level (psophometrically weighted) arising between 
  3244. the compressor and expander, both in dB relative to unaffected level. The 
  3245. resultant levels at the output of the expander will then be as given in 
  3246. Table\ 2\(hy2. 
  3247. .RT
  3248. .LP
  3249. .sp 1
  3250. .ce
  3251. \fBH.T. [T3.3]\fR 
  3252. .ce
  3253. TABLE\ 2\(hy2
  3254. .ps 9
  3255. .vs 11
  3256. .nr VS 11
  3257. .nr PS 9
  3258. .TS
  3259. center box;
  3260. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3261.     Speech    Noise while  speech present    Noise while  speech absent
  3262. _
  3263. .T&
  3264. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3265. Level at compressor input    S    \(em    \(em
  3266. .T&
  3267. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3268. Gain of compressor (dB)    \(emS/2    \(em    \(em
  3269. .T&
  3270. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3271.  {
  3272. Level at compressor output and expander input
  3273.  }    \ S/2    N    N
  3274. .T&
  3275. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3276. Gain of expander (dB)    \ S/2    S/2    N
  3277. .T&
  3278. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3279. Level at expander output    S    N |  | /2    2N
  3280. .T&
  3281. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3282.  {
  3283. Level at same point in absence of compander
  3284.  }    S    N    N
  3285. .T&
  3286. lw(120p) | cw(24p) | cw(42p) | cw(42p) .
  3287. Improvement    \(em    \(emS/2    \(emN
  3288. _
  3289. .TE
  3290. .nr PS 9
  3291. .RT
  3292. .ad r
  3293. \fBTable 2\(hy2 [T3.3], p.\fR 
  3294. .sp 1P
  3295. .RT
  3296. .ad b
  3297. .RT
  3298. .LP
  3299. .sp 1
  3300. .PP
  3301. Note that \fIS\fR  | and \fIN\fR  | are both normally negative, so that the
  3302. improvements are positive. Any noise present at the compressor input will be
  3303. present at the same level at the expander output, and will combine by power
  3304. addition with the other noise at the same point.
  3305. .bp
  3306. .PP
  3307. Subjectively equivalent performance is obtained by omitting the
  3308. compandor and substituting a continuous noise level satisfying the
  3309. condition:
  3310. .RT
  3311. .LP
  3312.     Total\ improvement
  3313.     =
  3314.     \ 1/3 (improvement in presence of speech) +
  3315. .LP
  3316. +2/3 (improvement in absence of speech)
  3317. .LP
  3318.     =
  3319.     \(em\fIS\fR /6 \(em 2\fIN\fR /3.
  3320. .LP
  3321. Hence
  3322. .LP
  3323.     equivalent\ noise\ level
  3324.     =
  3325.     \fIN\fR \(em improvement
  3326. .LP
  3327.     =
  3328.     \fIN\fR \ +\ \fIS\fR /6\ +\ 2\fIN\fR /3\ =\ \fIS\fR /6 +\ 5\fIN\fR /3.
  3329. .PP
  3330. This noise level is recalculated from \fIV\fR\d\fIC\fR\u | on each iteration 
  3331. and used to calculate the next value of \fIY\fR\d\fIL\fR\\d\fIE\fR\u. 
  3332. .sp 1P
  3333. .LP
  3334. 2.10.3
  3335.     \fIDelay and echo\fR 
  3336. .sp 9p
  3337. .RT
  3338. .PP
  3339. The audibility and objectionability of echo can be expressed
  3340. as a reasonably simple function of the delay and loudness rating of the
  3341. echo path, but the wider effects of echo and main\(hypath delay in disrupting
  3342. conversation can at present only be treated by \fIad hoc\fR estimation from the
  3343. known performance of circuit conditions in neighbouring parts of the range.
  3344. Steps are being taken to extend the model in this direction, account being
  3345. taken also of the interaction of delay and echo with sidetone and nonlinear
  3346. distortions.
  3347. .RT
  3348. .sp 1P
  3349. .LP
  3350. 2.10.4
  3351.     \fICrosstalk\fR 
  3352. .sp 9p
  3353. .RT
  3354. .PP
  3355. The loudness part of the model may be used to estimate the
  3356. audibility of crosstalk, at various attenuations, and hence to find the
  3357. attenuation required to reduce it to an inaudible level or to an acceptable
  3358. level.
  3359. .RT
  3360. .sp 1P
  3361. .LP
  3362. 2.11
  3363.     \fIPractical use of the model\fR 
  3364. .sp 9p
  3365. .RT
  3366. .PP
  3367. At the academic or research level, the chief use of a model of this kind 
  3368. is in promoting an understanding of the fundamentals of telecommunication 
  3369. between human beings, and in finding potential improvements in the techniques 
  3370. of telecommunication systems. 
  3371. .PP
  3372. At the practical level, the chief advantage of having the model
  3373. available is that it encodes the knowledge of the performance of telephone
  3374. connections in a very economical manner, obviating the need for large and
  3375. complex tabulations or graphs. For connections containing only the \*Qnatural\*U 
  3376. degradations, the program CATNAP greatly facilitates routine use of the 
  3377. model. The user of this program need not know anything about the theory 
  3378. beyond the 
  3379. meaning of the terms and symbols used, and need not normally make any special 
  3380. measurements. Connections are specified in terms of standard items and 
  3381. quantities, such as noise levels, telephones of particular types, lengths of
  3382. cable with stated resistance and capacitance per kilometre, and attenuators
  3383. with stated loss. Starting from these data, the program performs all the
  3384. necessary calculations and prints out loudness ratings, speech levels, and
  3385. opinion scores (\fIY\fR\d\fIL\fR\\d\fIE\fR\uand \fIY\fR\d\fIC\fR\u). More 
  3386. detail can be printed on request. 
  3387. .PP
  3388. It would of course be possible to construct a large table of results covering 
  3389. a wide range of connections, but the table would have to be either too 
  3390. large to be practical or else limited by making arbitrary fixed choices 
  3391. for 
  3392. many of the variables. In either case the advantage of having the model 
  3393. \(em that it holds the information in an economically coded form and releases 
  3394. only the 
  3395. required part on demand \(em would be lost.
  3396. .PP
  3397. CATNAP may also be used inversely. Suppose it is desired to find what value 
  3398. of some variable in a connection (the independent variable) will yield 
  3399. a given value of one of the dependent variables. By performing runs at 
  3400. different values of the independent variable one identifies a region within 
  3401. which the 
  3402. required value lies; one can then repeat the calculation at ever smaller
  3403. intervals until the required value is located with sufficient accuracy. For
  3404. example, where all features except the local line remain fixed, one can find
  3405. the line length (for the type of cable in question) that will yield values 
  3406. of OLR below some specified maximum, or values of \fIY\fR\d\fIC\fR\uabove 
  3407. some specified 
  3408. minimum. More than one independent variable could of course be adjusted, but
  3409. correspondingly more work would then be needed in order to find the
  3410. combinations that satisfied the criterion.
  3411. .PP
  3412. The usefulness of these facilities is evident.
  3413. .bp
  3414. .RT
  3415. .sp 2P
  3416. .LP
  3417. \fB3\fR \fBCalculation of transmission performance from objective measurements 
  3418. by the information index method\fR (Contribution by France) 
  3419. .sp 1P
  3420. .RT
  3421. .sp 1P
  3422. .LP
  3423. 3.1
  3424.     \fIIntroduction; type of model\fR 
  3425. .sp 9p
  3426. .RT
  3427. .PP
  3428. The information index theory is given in [31]. This quantity can be calculated 
  3429. from the results of objective measurements and some fundamental data on 
  3430. speech and hearing. Among the factors listed in Question\ 7/XII\ [32] the 
  3431. theory takes into account transmission loss, circuit noise, room noise,
  3432. attenuation/frequency distortion, sidetone and various distortions occuring 
  3433. in digital transmission (Question\ 18/XII). The effect of other types of 
  3434. nonlinear distortion is under study. 
  3435. .PP
  3436. The model used here belongs to the second type mentioned in [33] and in 
  3437. \(sc\ 2.1 of this Supplement, since it reflects de cause\(hyand\(hyeffect 
  3438. relationships between the input (properties of the connection considered,
  3439. acoustic environment, loudness properties of speech and hearing) and the 
  3440. output (mutual information transmitted between speaker and listener). This 
  3441. Section 
  3442. only describes the practical method for performing the computation of the
  3443. information index. As shown in\ [31] and also in Tables\ 3\(hy4 and\ 3\(hy7 
  3444. below, the values thus computed are strongly correlated with the results 
  3445. of subjective 
  3446. opinion tests carried out in several countries.
  3447. .RT
  3448. .sp 2P
  3449. .LP
  3450. 3.2
  3451.     \fIApplication to digital transmission\fR 
  3452. .sp 1P
  3453. .RT
  3454. .sp 1P
  3455. .LP
  3456. 3.2.1
  3457.     \fIDefinitions\fR 
  3458. .sp 9p
  3459. .RT
  3460. .PP
  3461. Table 3\(hy1 defines the various signal\(hyto\(hynoise ratios to be
  3462. considered (in\ dB).
  3463. .RT
  3464. .ce
  3465. \fBH.T. [T4.3]\fR 
  3466. .ce
  3467. TABLE\ 3\(hy1
  3468. .ps 9
  3469. .vs 11
  3470. .nr VS 11
  3471. .nr PS 9
  3472. .TS
  3473. center box;
  3474. cw(30p) sw(30p) | cw(120p) , c | c | ^ .
  3475. Notations    Definitions
  3476. See Note 1    See Note 2
  3477. _
  3478. .T&
  3479. cw(30p) | cw(30p) | lw(120p) .
  3480. \fIQ\fI    \fIQ\fR , \fIQ\fI     {
  3481. Signal\(hyto\(hynoise ratio, kept constant by a MNRU
  3482.  }
  3483. .T&
  3484. cw(30p) | cw(30p) | lw(120p) .
  3485. \fIQ\fI    \fIQ\fI     {
  3486. Segmental signal\(hyto\(hynoise or signal\(hyto\(hydistortion ratio (in dB) (mean of ratios computed over segments of 16 or 32 ms)
  3487.  }
  3488. .T&
  3489. cw(30p) | cw(30p) | lw(120p) .
  3490. \fIQ\fI         {
  3491. Ratio (in dB) of the mean signal power to mean noise or distortion power, for speech\(hycorrelated noise
  3492.  }
  3493. .TE
  3494. .LP
  3495. \fINote 1\fR
  3496. \ \(em\ Over the transmitted band.
  3497. .LP
  3498. \fINote 2\fR
  3499. \ \(em\ At frequency \fIf\fI .
  3500. .nr PS 9
  3501. .RT
  3502. .ad r
  3503. \fBTable 3\(hy1 [T4.3], p.\fR 
  3504. .sp 1P
  3505. .RT
  3506. .ad b
  3507. .RT
  3508. .PP
  3509. Let \fIs\fR  | be the original speech signal and \fIr\fR  | the reconstructed 
  3510. signal, we have: 
  3511. \v'6p'
  3512. .ce 1000
  3513. \fIQ\fR\d\fIP\fR\u= 10 log\d1\\d0\u
  3514. @ left [   int  fIs\fR~\u2\d~/  int  \fIs\fR~\(em~\fIr\fR )\u2\d right ] @  dB
  3515. .ce 0
  3516. .ad r
  3517. (3\(hy1)
  3518. \v'7p'
  3519. .ad b
  3520. .RT
  3521. .PP
  3522. .sp 1
  3523. If the sums are taken over an entire speech utterance, \fIQ\fR\d\fIp\fR\u | 
  3524. is not a satisfactory quality criterion; for a sampling frequency of 8\ 
  3525. kHz, we 
  3526. have:
  3527. \v'6p'
  3528. .ce 1000
  3529. \fIQ
  3530. \dseg
  3531. \u\fR =
  3532. [Unable to Convert Formula]
  3533. @ pile { fIM\fR~\(em1 above sum above \fIm\fR~=0 } @
  3534. 10 log\d1\\d0\u$$3o
  3535. @ pile { 28 above sum above \fIj\fR~=1 } @
  3536. \fIs\fR \u2\d (
  3537. \fIj\fR + 128 \fIm\fR )
  3538. $$3u
  3539. @ pile { 28 above sum above \fIj\fR~=1 } @
  3540. [\fIs\fR (
  3541. \fIj\fR + 128 \fIm\fR ) \(em
  3542. \fIr\fR (
  3543. \fIj\fR + 128 \fIm\fR )]\u2\d
  3544. $$3e dB
  3545. .ce 0
  3546. .ad r
  3547. (3\(hy2)
  3548. \v'1P'
  3549. \v'11p'
  3550. .ad b
  3551. .RT
  3552. .LP
  3553. .sp 1
  3554. where \fIM\fR  | is the number of 16 ms segments.
  3555. .bp
  3556. .PP
  3557. To determine \fIQ\fR\d\fIs\fR\u, the spectra of the signal, \fIs\fR  | 
  3558. and of the distortion (\fIs\fR \ \(em\ \fIr\fR ) are computed over 256\ 
  3559. samples of 32\ ms duration and divided into the appropriate frequency bands. 
  3560. Then the segmental 
  3561. signal\(hyto\(hydistortion ratio is computed in each band.
  3562. .sp 1P
  3563. .LP
  3564. 3.2.2
  3565.     \fIBasic formulas\fR 
  3566. .sp 9p
  3567. .RT
  3568. .PP
  3569. The 
  3570. information index
  3571. \fII\fR\d\fII\fR\u | (in dB), defined in [31],
  3572. is given by
  3573. \v'6p'
  3574. .RT
  3575. .ce 1000
  3576. \fII\fR\d\fII\fR\u= 
  3577. @ pile { sum above \fIj\fR } @ \fIB\fR\d\fIj\fR\u\(mu \fIV\fR\d\fIj\fR\u
  3578. .ce 0
  3579. .ad r
  3580. (3\(hy3)
  3581. \v'8p'
  3582. .ad b
  3583. .RT
  3584. .LP
  3585. .sp 1
  3586. with
  3587. \v'6p'
  3588. .ce 1000
  3589. \fIV\fR\d\fIj\fR\u= 
  3590. [Unable to Convert Formula]
  3591. .ce 0
  3592. .ad r
  3593. (3\(hy4)
  3594. \v'7p'
  3595. .ad b
  3596. .RT
  3597. .LP
  3598. .sp 1
  3599. .PP
  3600. \fIB\fR\d\fIj\fR\u | is the weight allocated to the band of rank\ \fIj\fR ;
  3601. \fIC\fR\d\fIj\fR\u\ =\ 10 log\d1\\d0\u(
  3602. \fIf\fR\d\fIj\fR\u/\(*D\fIf\fR\d\fIc\fR\u),
  3603. \(*D\fIf\fR\d\fIc\fR\u | being the 
  3604. critical bandwidth
  3605. .
  3606. .PP
  3607. Table 3\(hy2 gives the values of \fIB\fR\d\fIj\fR\u | and \fIC\fR\d\fIj\fR\u | 
  3608. for the bands 
  3609. which are used in the example of \(sc\ 3.2.4; they are reproduced in lines\ 70
  3610. and\ 80 of Appendix\ I. Values for ISO preferred frequencies (3rd\ octave 
  3611. spaced) from 0.1 to 8\ kHz are given in lines\ 180\(hy370 of Appendix\ 
  3612. II under columns\ BJ 
  3613. and\ CJ.
  3614. .RT
  3615. .LP
  3616. .sp 4
  3617. .ce
  3618. \fBH.T. [T5.3]\fR 
  3619. .ce
  3620. TABLE\ 3\(hy2
  3621. .ce
  3622. \fBFrequency weighting\fR 
  3623. .ps 9
  3624. .vs 11
  3625. .nr VS 11
  3626. .nr PS 9
  3627. .TS
  3628. center box;
  3629. cw(24p) | cw(84p) | cw(42p) | cw(42p) .
  3630. \fIj\fR     {
  3631. Equal articulation bands
  3632. Extreme frequencies (Hz)
  3633.  }    \fIB\fI  \(mu 10\u5\d    \fIC\fI  (dB)
  3634. _
  3635. .T&
  3636. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3637. \ 1    \  | 00    \  | 30    \ \ 5 | 57    4.1
  3638. .T&
  3639. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3640. \ 2    \  | 30    \  | 30    \ \ 4 | 33    5.6
  3641. .T&
  3642. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3643. \ 3    \  | 30    \  | 60    \ \ 6 | 82    6.4
  3644. .T&
  3645. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3646. \ 4    \  | 60    \  | 00    \ \ 7 | 97    6.9
  3647. .T&
  3648. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3649. \ 5    \  | 00    \  | 40    \ \ 6 | 46    7.4
  3650. .T&
  3651. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3652. \ 6    \  | 40    1 | 00    \ \ 6 | 22    7.8
  3653. .T&
  3654. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3655. \ 7    1 | 00    1 | 50    \ \ 5 | 85    8.0
  3656. .T&
  3657. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3658. \ 8    1 | 50    1 | 10    \ \ 5 | 00    8.0
  3659. .T&
  3660. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3661. \ 9    1 | 10    1 | 80    \ \ 5 | 73    8.2
  3662. .T&
  3663. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3664. 10    1 | 80    1 | 60    \ \ 5 | 17    8.2
  3665. .T&
  3666. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3667. 11    1 | 60    1 | 30    \ \ 4 | 17    8.2
  3668. .T&
  3669. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3670. 12    1 | 30    2 | 20    \ \ 4 | 06    8.2
  3671. .T&
  3672. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3673. 13    2 | 20    2 | 40    \ \ 5 | 73    8.2
  3674. .T&
  3675. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3676. 14    2 | 40    2 | 00    \ \ 5 | 61    8.2
  3677. .T&
  3678. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3679. 15    2 | 00    2 | 20    \ \ 6 | 10    8.2
  3680. .T&
  3681. cw(24p) | cw(42p) | cw(42p) | cw(42p) | cw(42p) .
  3682. 16    2 | 20    3 | 00    \ \ 6 | 86    8.1
  3683. _
  3684. .T&
  3685. lw(24p) | cw(84p) | cw(42p) | lw(42p) .
  3686.     TOTAL    102 | 58    
  3687. _
  3688. .TE
  3689. .nr PS 9
  3690. .RT
  3691. .ad r
  3692. \fBTable 3\(hy2 [T5.3], p.\fR 
  3693. .sp 1P
  3694. .RT
  3695. .ad b
  3696. .RT
  3697. .LP
  3698. .bp
  3699. .sp 1P
  3700. .LP
  3701. 3.2.3
  3702.      \fIRelations between signal\(hyto\(hynoise ratios in the case of digital\fR 
  3703. \fItransmission\fR 
  3704. .sp 9p
  3705. .RT
  3706. .PP
  3707. In the case of MNRUs with uniform or shaped noise, from the very
  3708. principle of their operation, \fIQ\fR\d\fIs\fR\u\ =\ \fIQ\fR\d\fIj\fR\uand 
  3709. Equation\ (3\(hy4) may be 
  3710. applied directly if \fIQ\fR\d\fIs\fR\uin each band is known.
  3711. .PP
  3712. For digital coders, the equivalence law in lines 150\(hy170 of
  3713. Appendix\ I is used. The law depends on two parameters, \fIK\fR\d1\uand
  3714. \fId\fR \ =\ \fIQ\fR\d\fIs\fR\\d\fIe\fR\\d\fIg\fR\u\ \(em\ \fIQ\fR\d\fIp\fR\u. 
  3715. Numerical computations have shown that this law is valid both for PCM (\fIK\fR\d1\u\ 
  3716. =\ 5.2; \fId\fR \ =\ 0) and for natural speech (\fIK\fR\d1\u\ =\ 5.2; \fId\fR 
  3717. \ =\ \(em5.3)\ [31]. The example of \(sc\ 3.2.4 shows that it gives 
  3718. consistent results for various types of coders.
  3719. .RT
  3720. .sp 1P
  3721. .LP
  3722. 3.2.4
  3723.     \fIProgram and example of application\fR 
  3724. .sp 9p
  3725. .RT
  3726. .PP
  3727. The program used is reproduced in Appendix I.
  3728. .PP
  3729. Table 3\(hy3 gives measured values of the signal\(hyto\(hynoise ratios 
  3730. defined above for MNRUs and for a variety of codecs, as well as the information 
  3731. index values computed from these results as the mean opinion scores (MOS) 
  3732. for 
  3733. listening determined in the CNET Laboratory\ [34].
  3734. .PP
  3735. Table 3\(hy4 shows the correlation of these MOS with the information
  3736. index (Table 3\(hy3) and with other objective measures of transmission
  3737. performance which have been proposed.
  3738. .RT
  3739. .sp 2P
  3740. .LP
  3741. 3.3
  3742.     \fIApplication to analogue transmission\fR 
  3743. .sp 1P
  3744. .RT
  3745. .sp 1P
  3746. .LP
  3747. 3.3.1
  3748.     \fIGeneral; use of the program\fR 
  3749. .sp 9p
  3750. .RT
  3751. .PP
  3752. The calculation of the information index, in the case of analogue transmission, 
  3753. will be explained with reference to the program reproduced as 
  3754. Appendix\ II. This applies to a connection composed of two telephone sets 
  3755. of the NTT\ 600 type (with 7\ dB subscriber lines), one SRAEN filter and 
  3756. a variable 
  3757. attenuation. Writing the corresponding program for other types of connection 
  3758. is discussed in \(sc\ 3.4. 
  3759. .PP
  3760. The program is used in the following way:
  3761. .RT
  3762. .LP
  3763.     a)
  3764.     enter RN, STMR, ICN\d0\u | as defined in lines 30\(hy60,
  3765. press\ \*QL\*U, enter OLR; read IN = information index
  3766. (listening);
  3767. .LP
  3768.     b)
  3769.     if \fII\fR\d\fIc\fR\u |
  3770. .FS
  3771. See Table 3\(hy5.
  3772. .FE
  3773. (information index under conversation conditions) is
  3774. required, press\ \*QC\*U; read IN = \fII\fR\d\fIc\fR\u;
  3775. .LP
  3776.     c)
  3777.     press \*QT\*U.
  3778. .sp 1P
  3779. .LP
  3780. 3.3.2
  3781.     \fIData\fR 
  3782. .sp 9p
  3783. .RT
  3784. .PP
  3785. Lines 170\(hy370 of the program.
  3786. .PP
  3787. Lines 180\(hy370 correspond to 1/3 octave spaced frequencies from 0.1 to
  3788. 8\ kHz.
  3789. .RT
  3790. .sp 1P
  3791. .LP
  3792. 3.3.2.1
  3793.     \fIBasic data\fR 
  3794. .sp 9p
  3795. .RT
  3796. .PP
  3797. These do not depend on the type of telephone set used.
  3798. .RT
  3799. .LP
  3800.     BK
  3801.     =
  3802.     Hearing threshold for continuous\(hyspectrum sounds
  3803. (\fIL\fR\d\fIs\fR\uin\ [31]) referred to ear reference point;
  3804. .LP
  3805.     S 
  3806.     =
  3807.     Spectrum density (long\(hyterm mean intensity) of speech
  3808. at the mouth reference point; S\ +\ 0.4\ dB corresponds
  3809. to a vocal level \(em4.7\ dB/1\ Pa;
  3810. .LP
  3811.     BJ
  3812.     =
  3813.     frequency weighting (see [31]);
  3814. .LP
  3815.     CJ
  3816.     =
  3817.     correction term in formula 3.4 giving \fIV\fR\d\fIj\fR\u.
  3818. .sp 1P
  3819. .LP
  3820. 3.3.2.2
  3821.     \fIElectroacoustic characteristics\fR 
  3822. .sp 9p
  3823. .RT
  3824. .PP
  3825. These depend on the connection considered.
  3826. .RT
  3827. .LP
  3828.     SRL
  3829.     = 
  3830.     Loss (send + receive) of the local system;
  3831. .LP
  3832.     D1
  3833.     =
  3834.     Loss of the line filter.
  3835. .bp
  3836. .ce
  3837. \fBH.T. [T6.3]\fR 
  3838. .ps 9
  3839. .vs 11
  3840. .nr VS 11
  3841. .nr PS 9
  3842. [Unable to Convert Table]
  3843. .LP
  3844. MNRUS
  3845. =\ MNRU with shaped noise
  3846. .LP
  3847. F
  3848. =\ ADPCM with fixed predictor
  3849. .LP
  3850. V
  3851. =\ ADPCM with variable predictor
  3852. .LP
  3853. SB
  3854. =\ Sub\(hyband coding
  3855. .nr PS 9
  3856. .RT
  3857. .ad r
  3858. \fBTable 3\(hy3 [T6.3],\ \ 
  3859. A L'ITALIENNE, p.\fR 
  3860. .sp 1P
  3861. .RT
  3862. .ad b
  3863. .RT
  3864. .LP
  3865. .bp
  3866. .ce
  3867. \fBH.T. [T7.3]\fR 
  3868. .ps 9
  3869. .vs 11
  3870. .nr VS 11
  3871. .nr PS 9
  3872. .TS
  3873. center box;
  3874. cw(342p) .
  3875. TABLE\ 3\(hy4
  3876. .T&
  3877. cw(342p) .
  3878.  {
  3879. \fBCorrelation between MOS and various objective measures of transmission
  3880. performance in the case of digital transmission\fR
  3881.  }
  3882. .TE
  3883. .TS
  3884. center box ;
  3885. cw(72p) | cw(30p) sw(24p) sw(30p) sw(24p) sw(30p) sw(24p) sw(30p) sw(24p) sw(30p) sw(24p) , ^  | c s | c | c s | c | c s 
  3886. ^  | c | c | c | c | c | c | c | c | c | c.
  3887. Objective measure  (Note)    Systems
  3888.     Group B  PCM, ADM, ADPCM\(hyF     {
  3889. Group A
  3890. same as B + ATC
  3891. APC \(em AB
  3892.  }     {
  3893. Group F
  3894. ADPCM\(hyF, ADPCM\(hyV
  3895.  }     {
  3896. Group E
  3897. same as F + sub\(hyband
  3898. coding
  3899.  }     {
  3900. Group D
  3901. same as E + MNRU
  3902. shaped MNRU
  3903.  }    R    S    R    S    R    S    R    S    R    S
  3904. _
  3905. .T&
  3906. lw(72p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | lw(24p) .
  3907. \fIQ\fI  (SNR)    0.798    0.578    0.803    0.559    0.687    0.680    0.590    0.711    0.650    
  3908. .T&
  3909. lw(72p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | lw(24p) .
  3910. \fIQ\fI  (SNR seg)    0.950    0.301    0.894    0.430    0.906    0.396    0.725    0.606    0.720    
  3911. .T&
  3912. lw(72p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | lw(24p) .
  3913. \*QLog likelihood ratio\*U    0.943    0.213    0.924    0.341                        
  3914. .T&
  3915. lw(72p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | lw(24p) .
  3916. Cepstrale distance    0.954    0.208    0.929    0.331                        
  3917. .T&
  3918. lw(72p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | lw(24p) .
  3919. SRNF                                    0.884    
  3920. .T&
  3921. lw(72p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  3922. Information index                    0.994    0.101    0.993    0.102    0.976    0.175
  3923. .TE
  3924. .LP
  3925. \fINote\fR
  3926. \ \(em\ Notations from Table 3\(hy1; see also Contribution COM
  3927. XII\(hyNo. 8 (Study Period 1985\(hy1988).
  3928. .LP
  3929. SNRF
  3930. =\ \fIQ\fI
  3931.  | frequency weighted
  3932. .LP
  3933. R
  3934. =\ Correlation coefficient
  3935. .LP
  3936. S
  3937. =\ Standard deviation (in terms of MOS on a 0 to 4 or 1 to 5 scale)
  3938. .nr PS 9
  3939. .RT
  3940. .ad r
  3941. \fBTable 3\(hy4 [T7.3]\ \ 
  3942. A L'ITALIENNE, p.\fR 
  3943. .sp 1P
  3944. .RT
  3945. .ad b
  3946. .RT
  3947. .LP
  3948. .bp
  3949. .sp 1P
  3950. .LP
  3951. 3.3.2.3
  3952.     \fINoise components\fR 
  3953. .sp 9p
  3954. .RT
  3955. .PP
  3956. The following components (which depend on the connection) are
  3957. considered.
  3958. .RT
  3959. .LP
  3960.     BDFE
  3961.     =
  3962.     spectrum of far\(hyend room noise via far\(hyend
  3963. telephone set;
  3964. .LP
  3965.     BDCN
  3966.     =
  3967.     spectrum of circuit noise;
  3968. .LP
  3969.     BDST
  3970.     =
  3971.     spectrum of near\(hyend room noise via sidetone
  3972. path;
  3973. .LP
  3974.     BDEL
  3975.     =
  3976.     spectrum of near\(hyend room noise via earcap
  3977. leakage.
  3978. .PP
  3979. The data at lines 180\(hy370 correspond to a typical connection. They are:
  3980. .LP
  3981.     FE
  3982.     =
  3983.     BDFE computed for RN\ =\ 50\ dBA and an overall loudness
  3984. rating (OLR), according to Recommendation\ P.79, of
  3985. 5\ dB;
  3986. .LP
  3987.     CN
  3988.     =
  3989.     BDCN computed for ICN\d0\u\ =\ \(em60\ dBmp;
  3990. .LP
  3991.     ST
  3992.     =
  3993.     BDST computes for RN\ =\ 50\ dBA and STMR = 15\ dB;
  3994. .LP
  3995.     EL
  3996.     =
  3997.     BDEL computed for RN\ =\ 50\ dBA.
  3998. .PP
  3999. The computations were made [35] from the frequency characteristics given 
  4000. in\ [36], by a method similar to that used for deriving Table\ 3 from 
  4001. Table\ 2 in\ [33].
  4002. .sp 2P
  4003. .LP
  4004. 3.3.3
  4005.     \fIComputation of signal\(hyto\(hynoise ratios\fR 
  4006. .sp 1P
  4007. .RT
  4008. .sp 1P
  4009. .LP
  4010. 3.3.3.1
  4011.     \fILevel of the signal\fR 
  4012. .sp 9p
  4013. .RT
  4014. .PP
  4015. First, OLR is corrected if it is smaller than the optimum value
  4016. (see Appendix\ II, lines\ 100\(hy160). This optimum is determined by a 
  4017. subroutine 
  4018. (lines\ 720\(hy810) which is similar to the formulas of\ [38], but was 
  4019. adapted to 
  4020. the results of subjective opinion tests published in\ [36].
  4021. .RT
  4022. .sp 1P
  4023. .LP
  4024. 3.3.3.2
  4025.     \fISignal\(hyto\(hynoise ratio\fR  | (lines 425\(hy440)
  4026. .sp 9p
  4027. .RT
  4028. .PP
  4029. The power sum of the noise components is taken and the
  4030. signal\(hyto\(hynoise ratio\ \fIZ\fR\d\fIn\fR\uthus obtained.
  4031. .RT
  4032. .sp 1P
  4033. .LP
  4034. 3.3.3.3
  4035.     \fIEffect of thresholds\fR  | (lines 450\(hy480)
  4036. .sp 9p
  4037. .RT
  4038. .PP
  4039. \fIZ\fR\d\fIa\fR\u | is computed (see [31]) from which the equivalent
  4040. signal\(hyto\(hynoise ratio\ \fIZ\fR\d\fIe\fR\uis derived. The resultant\ 
  4041. \fIZ\fR is obtained by 
  4042. power summation of the noises corresponding to \fIZ\fR\d\fIn\fR\uand\ \fIZ\fR\d\fIe\fR\u. 
  4043. .RT
  4044. .sp 1P
  4045. .LP
  4046. 3.3.4
  4047.     \fIInformation index for a constant speech level, I\fI\d\fIL\fR\u
  4048. .sp 9p
  4049. .RT
  4050. .PP
  4051. The equivalence between \fIZ\fR  | and \fIQ\fR  | is derived from the values
  4052. under \*QJapan\*U in Table\ 1 of [37], then \fIV\fR  | is computed at each 
  4053. frequency 
  4054. (lines\ 650\(hy700) and IN for listening is obtained (lines\ 500\(hy550).
  4055. .RT
  4056. .sp 1P
  4057. .LP
  4058. 3.3.5
  4059.     \fIConversation information index\fR \fI, I\fI\d\fIc\fR\u
  4060. .sp 9p
  4061. .RT
  4062. .PP
  4063. First, speech power is modified to take into account the effect of sidetone 
  4064. when talking (lines\ 90 and\ 560\(hy610), as in \(sc\ 2.7 above. 
  4065. .PP
  4066. A second correction is added (line 620), as explained in [31]. The
  4067. application of the present model to 13\(hy2P\(hy27\(hytype telephone sets 
  4068. with the 
  4069. equivalence law mentioned under\ 3.3.4 gives:
  4070. \v'6p'
  4071. .RT
  4072. .sp 1P
  4073. .ce 1000
  4074. \fIV\fR\d\fIc\fR\u\(em \fIV\fR\d\fIL\fR\u= 9.87 \(em 0.4085 \fII\fR\d\fIL\fR\u
  4075. .ce 0
  4076. .sp 1P
  4077. .LP
  4078. .sp 1
  4079. .sp 1P
  4080. .LP
  4081. 3.3.6
  4082.     \fIExamples\fR 
  4083. .sp 9p
  4084. .RT
  4085. .PP
  4086. Table 3\(hy5 gives the MOS determined subjectively in two tests (one listening, 
  4087. one under conversation conditions) for the same conditions, reported in\ 
  4088. [36], and the information indexes computed for these conditions. 
  4089. .PP
  4090. Table 3\(hy6 gives the subjective MOS determined for various conditions 
  4091. of noise and the corresponding listening information indexes. 
  4092. .PP
  4093. Table 3\(hy7 shows the correlation between subjective MOS and the values 
  4094. of information index given in Table\ 3\(hy5 and Table\ 3\(hy6, as well 
  4095. as the results of similar calculations for 13\(hy2P\(hy27\(hytype telephone 
  4096. sets. 
  4097. .bp
  4098. .RT
  4099. .ce
  4100. \fBH.T. [T8.3]\fR 
  4101. .ce
  4102. TABLE\ 3\(hy5
  4103. .ce
  4104. \fBInformation index I for NTT 600\(hytype telephone sets (7 dB line) with
  4105. .ce
  4106. SRAEN filter,\fR 
  4107. .ce
  4108. \fBSTMR = 7.1 dB and opinion scores from tests
  4109. .ce
  4110. 2 and 6\fR 
  4111. .ps 9
  4112. .vs 11
  4113. .nr VS 11
  4114. .nr PS 9
  4115. .TS
  4116. center box;
  4117. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4118. RN  (dBA)    CN  (dBmp)    ICN 0  (dBmp)    OLR  (dB)    \fIY\fI    \fII\fI  (dB)    \fIY\fI    \fII\fI  (dB)
  4119. _
  4120. .T&
  4121. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4122. (1)    (2)    (3)    (4)    (5)    (6)    (7)    (8)
  4123. _
  4124. .T&
  4125. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4126. 60    \(em62.1    \(em58.2    \ 1.4    3.13    23.48    2.94    23.27
  4127. .T&
  4128. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4129.             11.4    2.5\     22.75    2.34    22.50
  4130. .T&
  4131. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4132.             21.4    2.31    19.44    1.58    19.52
  4133. .T&
  4134. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4135.             31.4    0.65    12.28    0.2\     15.13
  4136. .T&
  4137. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4138. 60    \(em59.8    \(em55.9    \ 1.4    3.1\     23.52        
  4139. .T&
  4140. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4141.             11.4    2.91    22.73        
  4142. .T&
  4143. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4144.             21.4    1.75    19.35        
  4145. .T&
  4146. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4147.             31.4    0.8\     12.02        
  4148. .T&
  4149. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4150. 60    \(em55.8    \(em51.9    \ 1.4    2.83    23.59    2.99    23.38
  4151. .T&
  4152. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4153.             11.4    2.75    22.65    2.39    22.39
  4154. .T&
  4155. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4156.             21.4    1.79    19.03    1.28    19.20
  4157. .T&
  4158. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4159.             31.4    0.5\     11.24    0.43    14.71
  4160. .T&
  4161. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4162. 60    \(em51.4    \(em47.5    \ 1.4    3.06    23.66    3.08    23.43
  4163. .T&
  4164. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4165.             11.4    2.24    22.44    2.17    22.16
  4166. .T&
  4167. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4168.             21.4    1.05    18.27    1.29    18.64
  4169. .T&
  4170. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4171.             31.4    0.09    \ 9.3\     0.22    14.11
  4172. .T&
  4173. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4174. 60    \(em45.6    \(em41.7    \ 1.4    2.31    23.64    2.63    23.37
  4175. .T&
  4176. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4177.             11.4    1.4\     21.67    1.73    21.39
  4178. .T&
  4179. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4180.             21.4    0.64    16.2\     0.77    17.23
  4181. .T&
  4182. cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) | cw(30p) | cw(24p) .
  4183.             31.4    0.05    \ 5.57    0.13    12.08
  4184. .TE
  4185. .LP
  4186. \fIExplanation of columns\fR
  4187. .LP
  4188. (1)
  4189. Room noise, dBA
  4190. .LP
  4191. (2)
  4192. Circuit noise at input to receiving end, dBmp
  4193. .LP
  4194. (3)
  4195. ICN
  4196. 0 = CN + 3.9 dB
  4197. .LP
  4198. (4)
  4199. OLR (Rec. P.79)
  4200. .LP
  4201. (5)
  4202. Listening MOS (on a 0 to 4 scale), test 2 of
  4203. [36], p.\ 4\(hy4
  4204. .LP
  4205. Listening information index (position L of Appendix II)
  4206. .LP
  4207. Conversation MOS, test 6 of [36], p. 4\(hy9
  4208. .LP
  4209. Conversation opinion index (position C of
  4210. Appendix\ II)
  4211. .nr PS 9
  4212. .RT
  4213. .ad r
  4214. \fBTableau 3\(hy5 [T8.3], p. 32\fR 
  4215. .sp 1P
  4216. .RT
  4217. .ad b
  4218. .RT
  4219. .LP
  4220. .rs
  4221. .sp 8P
  4222. .ad r
  4223. Blanc
  4224. .ad b
  4225. .RT
  4226. .LP
  4227. .bp
  4228. .ce
  4229. \fBH.T. [T9.3]\fR 
  4230. .ce
  4231. TABLE\ 3\(hy6
  4232. .ce
  4233. \fBInformation index at listening for NTT 600\(hytype telephone sets (7 dB
  4234. .ce
  4235. line) with SRAEN filter,\fR 
  4236. .ce
  4237. \fBSTMR = 7.1 dB and listening
  4238. .ce
  4239. opinion score from test 4\fR 
  4240. .ps 9
  4241. .vs 11
  4242. .nr VS 11
  4243. .nr PS 9
  4244. .TS
  4245. center box;
  4246. cw(36p) | cw(42p) | cw(42p) | cw(36p) | cw(36p) | cw(36p) .
  4247. RN  (dBA)    CN  (dBmp)    ICN 0  (dBmp)    OLR  (dB)    \fIY\fI    \fII\fI  (dB)
  4248. _
  4249. .T&
  4250. cw(36p) | cw(42p) | cw(42p) | cw(36p) | cw(36p) | cw(36p) .
  4251. \ 0    \fB.\fR (see Note)     {
  4252. \(em100\fB.\ \fR
  4253. (see Note)
  4254.  }     {
  4255. \(em3.6
  4256. \ 1.4
  4257. \ 6.4
  4258. \ 11.4
  4259. \ 16.4
  4260. \ 21.4
  4261. \ 26.4
  4262. \ 31.4
  4263.  }     {
  4264. 2.30
  4265. 2.83
  4266. 3.26
  4267. 2.92
  4268. 2.59
  4269. 2.12
  4270. 1.89
  4271. 1.23
  4272.  }     {
  4273. 22.87
  4274. 23.40
  4275. 23.85
  4276. 23.55
  4277. 23.05
  4278. 22.45
  4279. 21.73
  4280. 20.91
  4281.  }
  4282. _
  4283. .T&
  4284. cw(36p) | cw(42p) | cw(42p) | cw(36p) | cw(36p) | cw(36p) .
  4285. 60    \(em55.8    \ \(em51.9     {
  4286. \(em3.6
  4287. \ 1.4
  4288. \ 6.4
  4289. \ 11.4
  4290. \ 16.4
  4291. \ 21.4
  4292. \ 26.4
  4293. \ 31.4
  4294.  }     {
  4295. 2.61
  4296. 2.94
  4297. 3.00
  4298. 2.38
  4299. 1.80
  4300. 1.41
  4301. 0.91
  4302. 0.44
  4303.  }     {
  4304. 22.78
  4305. 23.59
  4306. 23.51
  4307. 22.65
  4308. 21.24
  4309. 19.03
  4310. 15.95
  4311. 11.44
  4312.  }
  4313. _
  4314. .T&
  4315. cw(36p) | cw(42p) | cw(42p) | cw(36p) | cw(36p) | cw(36p) .
  4316. 60    \(em56.9    \ \(em53\fB.9\fR    \ 1.4 \ 11.4 \ 21.4 \ 31.4    3.20 2.53 1.24 0.24    23.57 22.68 19.15 11.51
  4317. _
  4318. .T&
  4319. cw(36p) | cw(42p) | cw(42p) | cw(36p) | cw(36p) | cw(36p) .
  4320. 50    \(em55.8    \ \(em51.9    \ 1.4 \ 11.4 \ 21.4 \ 31.4    3.21 2.64 1.58 0.35    23.88 23.24 21.04 15.94
  4321. _
  4322. .T&
  4323. cw(36p) | cw(42p) | cw(42p) | cw(36p) | cw(36p) | cw(36p) .
  4324. 45    \(em64.9    \ \(em61\fB.9\fR    \ 1.4 \ 13.4    3.23 2.62     {
  4325. 23.77
  4326. 23.24
  4327.  }
  4328. .TE
  4329. .LP
  4330. \fINote\fR
  4331. \ \(em\ In these cases, there was no circuit noise during the opinion tests
  4332. but a noise corresponding to CN\ =\ \(em76.9 (ICN
  4333. 0\ =\ \(em73) is used in the OPINE
  4334. model. An arbitrary low noise value may be used for the calculation of the
  4335. information index.
  4336. .nr PS 9
  4337. .RT
  4338. .ad r
  4339. \fBTableau 3\(hy6 [T9.3], p. 33\fR 
  4340. .sp 1P
  4341. .RT
  4342. .ad b
  4343. .RT
  4344. .LP
  4345. .rs
  4346. .sp 11P
  4347. .ad r
  4348. Blanc
  4349. .ad b
  4350. .RT
  4351. .LP
  4352. .bp
  4353. .ce
  4354. \fBH.T. [T10.3]\fR 
  4355. .ps 9
  4356. .vs 11
  4357. .nr VS 11
  4358. .nr PS 9
  4359. .TS
  4360. center box;
  4361. cw(342p) .
  4362. TABLE\ 3\(hy7
  4363. .T&
  4364. cw(342p) .
  4365.  {
  4366. \fB\fBCorrelation between MOS and the information index in the case of
  4367. analogue transmission\fR
  4368.  }
  4369. .TE
  4370. .TS
  4371. center box ;
  4372. cw(90p) | cw(36p) sw(36p) sw(36p) | cw(36p) | cw(36p) | cw(36p) sw(36p) , ^  | c | c | c ^  | ^  | | c | c.
  4373. Type of connection     {
  4374. Range of conditions (see Note)
  4375.  }    Type of MOS    Correlation coefficient     {
  4376. Deviation in terms of \fIY\fR
  4377.  }
  4378.     RN  (dBA)    ICN 0  (dBmp)    OLR  (dB)    Standard error    Extreme deviations
  4379. _
  4380. .T&
  4381. lw(90p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) , ^  | c | c | c | c | c | c | c.
  4382.  {
  4383. NTT 600\(hytype telephone sets + SRAEN filter
  4384.  }    0 to 60     {
  4385. \(em\(if and
  4386. \(em61\fB.\ \fR
  4387. to \(em52\fB.\ \fR
  4388.  }    \(em3.6 to +31.4    Y L    0.978    0.15    \(em0.34 + 0.31
  4389.     60    \(em58.2 to \(em41.7    +1.4 to +31.4    Y C    0.977    0.16    \(em0.32 + 0.32
  4390. _
  4391. .T&
  4392. lw(90p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) | cw(36p) , ^  | c | c | c | c | c | c | c.
  4393.  {
  4394. 13\(hy2P\(hy27\(hytype telephone sets + attenuator
  4395.  }    50     {
  4396. \(em\(if and
  4397. \(em71\fB.\ \fR
  4398. to \(em49\fB.\ \fR
  4399.  }     {
  4400. \ +4\fB.6\fR
  4401. to +48\fB.4\fR
  4402.  }    Y C    0.995    0.07    \(em0.17 + 0.16
  4403. .TE
  4404. .LP
  4405. \fINote\fR
  4406. \ \(em\ Notations are of Appendix II.
  4407. .TE
  4408. .nr PS 9
  4409. .RT
  4410. .ad r
  4411. \fBTableau 3\(hy7 [T10.3], \ \ A L'ITALIENNE, p. 34\fR 
  4412. .sp 1P
  4413. .RT
  4414. .ad b
  4415. .RT
  4416. .LP
  4417. .bp
  4418. .sp 2P
  4419. .LP
  4420. 3.4
  4421.     \fIPossible extensions\fR 
  4422. .sp 1P
  4423. .RT
  4424. .sp 1P
  4425. .LP
  4426. 3.4.1
  4427.     \fIFrequency characteristics\fR 
  4428. .sp 9p
  4429. .RT
  4430. .PP
  4431. Appendix II gives an example which is explained in \(sc\ 3.3 above. If 
  4432. different types of sets, balancing networks, subscriber's lines or line 
  4433. filters are used, the corresponding data in Appendix\ II should be changed 
  4434. accordingly and the noise data recalculated. This is the same procedure 
  4435. as is given in the model of \(sc\ 2.4 above and is explained in\ [33]. 
  4436. .PP
  4437. OLR and STMR, used as independent variables, should be recalculated
  4438. according to Recommendation\ P.79.
  4439. .RT
  4440. .sp 1P
  4441. .LP
  4442. 3.4.2
  4443.     \fIConnection including digital processes\fR 
  4444. .sp 9p
  4445. .RT
  4446. .PP
  4447. Paragraph\ 3.2 above and Appendix\ I apply to cases where speech is near 
  4448. its optimum level, in order to compare different coders under such 
  4449. conditions. If the coders give rise to appreciable clipping, the loss of
  4450. information due to this effect should be calculated and the corresponding 
  4451. value of\ \fIQ\fR determined as explained in\ [31]. 
  4452. .PP
  4453. Anyhow, when digital process are included in a connection of a
  4454. telephone network, the corresponding values of \fIQ\fR\d\fIm\fR\ushould 
  4455. be determined in each frequency band and combined with the value of\ \fIQ\fR 
  4456. in Appendix\ II, by a 
  4457. power summation of the noises and distortions.
  4458. .RT
  4459. .LP
  4460. .rs
  4461. .sp 35P
  4462. .sp 2P
  4463. .LP
  4464. \fBMONTAGE : \ \ \ \(sc.4 SUR LE RESTE DE CETTE PAGE\fR 
  4465. .sp 1P
  4466. .RT
  4467. .LP
  4468. .bp
  4469.